教育行业A股IPO第一股(股票代码 003032)

全国咨询/投诉热线:400-618-4000

全部 大数据新闻动态 大数据技术文章 大数据常见问题 技术问答

    • 学好Zookeeper Java API是大数据基础加强的必修

      Zookeeper 是在 Java 中客户端主类,负责建立与 zookeeper 集群的会话, 并提供方法进行操作。 org.apache.zookeeper.Watcher 查看全文>>

      大数据技术文章2018-11-16 |传智播客 |Zookeeper,大数据

    • 大数据离线阶段Day8之MapReduce工作机制详解

      整个Map阶段流程大体如上图所示。简单概述:input File通过split被逻辑切分为多个split文件,通过Record按行读取内容给map(用户自己实现的)进行处理,数据被map处理结束之后交给OutputCollector收集器,对其结果key进行分区(默认使用hash分区),然后写入buffer,每个map task都有一个内存缓冲区,存储着map的输出结果,当缓冲区快满的时候需要将缓冲区的数据以一个临时文件的方式存放到磁盘,当整个map task结束后再对磁盘中这个map task产生的所有临时文件做合并,生成最终的正式输出文件,然后等待reduce task来拉数据。 查看全文>>

      大数据技术文章2018-10-24 |传智播客 |传智播客,大数据

    • 面试题之趣味逻辑题

      1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 查看全文>>

      大数据技术文章2018-10-24 |传智播客 |传智播客,大数据

    • 面试题之hadoop相关

      首先map task会从本地文件系统读取数据,转换成key-value形式的键值对集合   使用的是hadoop内置的数据类型,比如longwritable、text等 查看全文>>

      大数据技术文章2018-10-24 |传智播客 |传智播客,大数据,hadoop

    • Scala编译器安装

      1.1. 安装JDK 因为Scala是运行在JVM平台上的,所以安装Scala之前要安装JDK。 查看全文>>

      大数据技术文章2018-09-30 |传智播客 |大数据,Scala

    • spark笔记之Spark运行架构

      构建Spark Application的运行环境(启动SparkContext),SparkContext向资源管理器(可以是Standalone、Mesos或YARN)注册并申请运行Executor资源 查看全文>>

      大数据技术文章2018-09-11 |传智播客 |传智播客,Spark运行架构

    • spark笔记之RDD容错机制之checkpoint

      Spark 在生产环境下经常会面临transformation的RDD非常多(例如一个Job中包含1万个RDD)或者具体transformation的RDD本身计算特别复杂或者耗时(例如计算时长超过1个小时),这个时候就要考虑对计算结果数据持久化保存 查看全文>>

      大数据技术文章2018-09-11 |传智播客 |传智播客,spark

    • Scala概述

      Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。 查看全文>>

      大数据技术文章2018-08-10 |传智播客 |云计算大数据,Scala

    << < 1 ... 26 27 28 29 30 31 32 33 34 35 > >>
和我们在线交谈!