java实现在不同编码之间进行文件转换
使用 InputStreamReader 或者FileReader 类,它们可以自动地把某个特定字符编码转换为本地字符代码。否则就使用DataOutputStream 类当中的writeUTF()方法以Unicode 文本写字符串,当然,读取的时候必须使用DataInputStream 打开它,并且使用readUTF()方法读取这些字符串。
为什么要转换编码呢?大家都知道,Java 语言是以Unicode 为基础的,但是操作系统都有它们自己内部的可能是与Unicode 不兼容的编码方式,所以用户收到的输入可能属于不同的代码系统,程序显示给用户的字符串最终必须使用当地的操作系统可以识别的方法对其进行译码。
转换不同编码,具体实现步骤:
编写ConvertEncoding 类的基本框架,该类包括main()方法、usage()方法和convert()方法:
public class ConvertEncoding
public static void main(String[] args);
public static void usage();
public static void convert(String infile, String outfile, String from, String to)
throws IOException, UnsupportedEncodingException;
}
Main()方法实现了实现了把一种编码形式的文件,转换成为另外一种编码形式:
public static void main(String[] args)
{
String from = null, to = null;
String infile = null, outfile = null;
for(int i = 0; i
if (i == args.length-1) usage(); .
if (args[i].equals("-from")) from = args[++i];
else if (args[i].equals("-to")) to = args[++i];
else if (args[i].equals("-in")) infile = args[++i];
else if (args[i].equals("-out")) outfile = args[++i];
else usage();
}
try { convert(infile, outfile, from, to); } // 开始转换
catch (Exception e)
{ // 处理例外
System.exit(1);
}
}
usage()方法实现了提醒用户命令行的正确输入,代码如下:
public static void usage()
{
System.err.println("Usage: java ConvertEncoding \\n" +
"Options:\\n\\t-from \\n\\t" +
"-to \\n\\t" +
"-in \\n\\t-out ");
System.exit(1);
}
Convert()方法实现了编码方式的转换,代码如下:
public static void convert(String infile, String outfile, String from, String to)
throws IOException, UnsupportedEncodingException
{
// Set up byte streams.
InputStream in;
if (infile != null) in = new FileInputStream(infile);
else in = System.in;
OutputStream out;
if (outfile != null) out = new FileOutputStream(outfile);
else out = System.out;
// 设置缺省的编码方式
if (from == null) from = System.getProperty("file.encoding");
if (to == null) to = System.getProperty("file.encoding");
// 建立用于读写的字符流
Reader r = new BufferedReader(new InputStreamReader(in, from));
Writer w = new BufferedWriter(new OutputStreamWriter(out, to));
/** 把字符从输入Copy 到输出。InputStreamReader
* 把字符从原始编码方式转为Unicode
* OutputStreamWriter 则把字符从Unicode 编码转换为指定的输出编码方式
* 不能用指定输出编码方式编码的字符输出为'?'
**/
char[] buffer = new char[4096];
int len;
while((len = r.read(buffer)) != -1) .
w.write(buffer, 0, len); .
r.close(); .
w.close();
}
注意:ConvertEncoding 类需要引入import java.io.*;
¥29.00
¥498.00
¥399.00
¥299.00