三星最新连接软件setup_1.0.0.HKBSamsung_PC_Studio_7_7.1.39.8最新更新 Samsung_PC_Studio_322_HJ2
发新话题
打印

[分享] 关于港行W850i的Walkman播放器乱码的不完全解决方案

关于港行W850i的Walkman播放器乱码的不完全解决方案

第0章 引言
    很多人用小8,很多人有港行,很多人求助w850i中walkman显示演唱者和专辑名称等的乱码问题,怎么办?本文仅针对港行W850i提出相应解决方案,仅供参考。
第1章 乱码的原因
    乱码,顾名思义,显示错乱、让人无法阅读的编码。
    为什么会出现乱码?究其原因,源文件编码和系统显示编码不同,使用的字符集不同,不能被正确识别。当然,还有其它原因,就不在本文讨论的范围内了。
第2章 字符集
    字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集有:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
    2.1 GB2312字符集
        2.1.1 名称的由来
    GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施。
        2.1.2 特点
    GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。
        2.1.3 包含内容
    GB2312 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在 内的682个全角字符。
    2.2 BIG5字符集
        2.2.1 名称的由来
    又称大五码或五大码,1984年由{被屏蔽内容}财团法人信息工业策进会和五间软件公司宏碁 (Acer)、神通 (MiTAC)、佳佳、零壹 (Zero One)、大众 (FIC)创立,故称大五码。
    Big5码的产生,是因为当时{被屏蔽内容}不同厂商各自推出不同的编码,如倚天码、IBM PS55、王安码等,彼此不能兼容;另一方面,{被屏蔽内容}政府当时尚未推出官方的汉字编码,而中国大陆的GB2312编码亦未有收录繁体中文字。
        2.2.2 特点
    Big5字符集共收录13,053个中文字,该字符集在中国{被屏蔽内容}使用。
    2.3 Unicode字符集
        2.3.1 名称的由来
    Unicode 字符集编码是Universal Multiple-Octet Coded Character Set 通用多八位编码字符集的简称,是由一个名为 Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统,支持现今世界各种不同语言的书面文本的交换、处理及显示。该编码于1990年开始研发,1994年正式 公布,最新版本是2005年3月31日的Unicode 4.1.0。
        2.3.2 特征
    Unicode是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
        2.3.3 编码方法
    Unicode 标准始终使用十六进制数字,而且在书写时在前面加上前缀“U+”。
    2.4 UTF-8 编码
    UTF-8是Unicode的其中一个使用方式。 UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。
    UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。
    UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。
    2.4 UTF-16 和 UTF-32 编码
    UTF -32、UTF-16 和 UTF-8 是 Unicode 标准的编码字符集的字符编码方案,UTF-16 使用一个或两个未分配的 16 位代码单元的序列对 Unicode 代码点进行编码;UTF-32 即将每一个 Unicode 代码点表示为相同值的 32 位整数。
    2.5 小结
    综上所述,不难看出,UTF-16是我们比较理想的一种编码方式。小8支持吗?生于2006的小8似乎没理由不支持吧?!
第3章 Walkman播放器乱码的解决方案
    以上您可以不看,这里您必须仔细看了!
    3.1 笨方法:一叶障目
    这个方法就如最初坛子里一些人推荐的:把那些标签删了!
    偶曾经也是顶礼膜拜的一种方法,当然也是肯定可以“完美”解决“乱码”问题的一个方法。没有“码”了,让它乱去吧,眼不见心不烦!
    但转念一想:正常人把眼睛遮着不见人,这跟瞎子又有什么区别?!
    3.2 正常思维:转码
    偶们正常下载的MP3标签一般是中文(听英文歌和国外的用户表砸我),使用的编码是GB国标码,小8不支持!
    那就转呗!俺们转成小8支持的BIG5码成不?
    Sure!
    偶也是这么想的!为此还专门找到了一款不错的可以批量转换MP3的ID3标签编码的软件Convertz,可以将MP3的ID3标签编码在GBK/BIG5之间相互转换。小弟没有权限上传附件,大家可以到CrSky下载convertz 8.02 绿色版。至于怎么用,自己回去慢慢研究吧。
    Copy进小8,可以正常显示繁体的中文标签啦!不过在电脑里面就显示成“乱码”了,唉,还是乱码!将就吧,有总比没有强!
    3.3 灵光一闪: Unicode吧
    久违的UTF!偶不小心把你忘在墙角了!Sorry……
    偶然想起来似乎千千静听也是可以修改标签编码的,试试咯,反正不花钱!……眼前一亮——偶亲爱的UTF回来了!
    如下图所示选择,然后保存修改,OK!电脑里面还是和原来一样啊,没变化!小8认识吗?心虚哦!
    ……恭喜你啦!成功了吧?!
第4章 小结
    都是废话,看3.3节吧,只有那里是有用的!
参考文献:
1.中文字符集与字符编码的基础知识
2.千千静听用户手册
3.Google Search
版权声名:
Sheacle@IT168索爱论坛 原创    转载请注明出处
2007 | Copy right reserved
Sheacle @ IT168索爱论坛

附件: 您所在的用户组无法下载或查看附件

TOP

发新话题