`
tenght
  • 浏览: 47101 次
社区版块
存档分类
最新评论
文章列表
概述 SequenceFile由一系列的二进制key/value组成,如果为key小文件名,value为文件内容,则可以将大批小文件合并成一个大文件。可以看做是一个容器,它将这些小文件组织起来统一存储,就像建筑用的“泥坯块”一样,方方正 ...
通过上一篇的讲述,我们知道hadoop中的Text类,跟java中的String类很相似,在其定义的方法上,也多有相近之处,当然,由于用途、UTF编码的不同,两者之间还是有很大的区别。下面要讲实例除了测试Text的方法之外,着重跟java.lang.String进行比较。 1、首先,我们来看生成String串的方法: 源码如下: // 生成java字符串 private static String getTestString(int len) throws Exception { StringBuilder buffer = new StringBuilder( ...
hadoop中的Text类,跟java中的String类很相似,在其定义的方法上,也多有相近之处,当然,由于用途的不同,两者之间还是有很大的区别的,那么,在分析Text类之前,先来回顾下java.lang.String类。 1、java中的String类: String类代表字符串。Java程序中的所有字符串字面值(如"abc")都作为此类的实例实现。 字符串是常量;它们的值在创建之后不能更改。字符串缓冲区支持可变的字符串。因为String对象是不可变的,所以可以共享。例如: Stringstr="abc"; 等效于: chard ...
用到的开源工具包:hamcrest,junit IDE:MyEclipse 2013 SR1 用到的工具: 1、String java.lang.String.format(Locale l,String format,Object... args) 使用指定的语言环境、格式字符串和参数返回一个格式化字符串。 参数: l - 格式化过程中要应 ...
Writable子接口: Hadoop引入org.apache.hadoop.io.Writable接口,是所有可序列化对象必须实现的接口 在hadoop2.71.中,Writable共有6个子接口: Counter,CounterGroup,CounterGroupBase<T>,InputSplit,InputSplitWithLocationInfo,WritableComparable<T> 在org.apac ...
由于Hadoop的MapReduce和HDFS都有通信的需求,需要对通信的对象进行序列化。Hadoop并没有采用Java的序列化,而是基于java.io里的DataOutput和DataInput引入了它自己的系统,一个简单高效的序列化协议。 org.apache.hadoop.io中定义了大量的可序列化对象,他们都实现了Writable接口。 我们先来看hadoop2.7.1中Writable接口的源码: package org.apache.hadoop.io; import java.io.DataOutput; import java.io.DataInput; impor ...
import java.math.BigDecimal; import java.util.Date; import java.util.Map; /** * <p> * Map取值方法,其中取得多种值,避免null值转换 * </p> * @author hailan * */ public class MapGetterTool { private Map<String,Object> map; public MapGetterTool(Map<String,Object> map){ this.map = ma ...
import java.lang.reflect.Field; import java.lang.reflect.Method; import java.math.BigDecimal; import java.text.SimpleDateFormat; import java.util.Date; import java.util.HashMap; import java.util.Map; /** * HashMap与Bean互转工具类 * * @author hailan * @time 2015-10-12下午05:56:34 */ public class HashMa ...
import java.math.BigDecimal; /** * 运算工具 * * 提供精确的浮点数运算,包括加减乘除和四舍五入 * * @author lchhh0005 * */ public class ArithTool { // 默认除法算法精确度 private static final int DEF_DIV_SCALE = 10; private ArithTool() { } /** * 提供精确的加法运算 * @param v1 * @param v2 * @return */ public static d ...
Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了Base64来将一个较 ...
引子        当前,随着时代的发展,网络技术的不断进步,不论企业还是个人都越来越离不开网络,网络安全也逐渐引起了人们的关注。然而,在由无数个节点和链路构建起来的纷繁复杂的网络系统中,看似简单的路由器却是网络系统中最为核心的节点,是能够影响网络安全的关键设备。因此,在网络安全管理上,在现代网络通信设备网络路由器是最重要的,作为一个桥梁连接两个不同的网段,路由器越来越被人们所重视。   影响路由器安全的因素     影响路由器安全的因素,主要体现在管理和技术两个方面上。   在管理上      对路由器口令的选择、设置,协议授权机制不适当的使用,接口的错误配置等因素,都可能导 ...
概述       Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,正因为如此,面向对象是其非常重要的特性,在Python中创建一个类和对象是很容易的。Python 源代码同样遵循 GPL(GNU General Public License)协议 。       Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏 ...
import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import java.util.ArrayList; import java.util.List; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.Doc ...
<pre name="code" class="java"> /** * <DL> * <DT><B> 功能说明</B></DT> * 字符串全半角互转 * </DL> * @author hailan */ public class SBCChange { // public static void main(String[] args) { // // String QJstr = "全角转半角DAO喆4 "; // ...
/* * To change this template, choose Tools | Templates * and open the template in the editor. */ import java.io.BufferedOutputStream; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import ...
Global site tag (gtag.js) - Google Analytics