java实现汉字转换为拼音 -凯发k8网页登录

北极心空

  凯发k8网页登录-凯发天生赢家一触即发官网 :: 凯发k8网页登录首页 :: 联系 :: 聚合  :: 管理
  15 posts :: 393 stories :: 160 comments :: 0 trackbacks

java实现汉字转换为拼音

import  java.util.iterator;
import  java.util.linkedhashmap;
import  java.util.set;

/**
 *
 汉字转化为全拼
 *
 jdk版本: 1.4
*/
public   class  cntospell {
    
private   static  linkedhashmap spellmap  =   null ;

    
static  {
        
if  (spellmap  ==   null ) {
            spellmap 
=   new  linkedhashmap( 400 );
        }
        initialize();
        system.out.println(
" chinese transfer spell done. " );
    }

    
private  cntospell() {
    }

    
private   static   void  spellput(string spell,  int  ascii) {
        spellmap.put(spell, 
new  integer(ascii));
    }

    
private   static   void  initialize() {
        spellput(
" a " - 20319 );
        spellput(
" ai " - 20317 );
        spellput(
" an " - 20304 );
        spellput(
" ang " - 20295 );
        spellput(
" ao " - 20292 );
        spellput(
" ba " - 20283 );
        spellput(
" bai " - 20265 );
        spellput(
" ban " - 20257 );
        spellput(
" bang " - 20242 );
        spellput(
" bao " - 20230 );
        spellput(
" bei " - 20051 );
        spellput(
" ben " - 20036 );
        spellput(
" beng " - 20032 );
        spellput(
" bi " - 20026 );
        spellput(
" bian " - 20002 );
        spellput(
" biao " - 19990 );
        spellput(
" bie " - 19986 );
        spellput(
" bin " - 19982 );
        spellput(
" bing " - 19976 );
        spellput(
" bo " - 19805 );
        spellput(
" bu " - 19784 );
        spellput(
" ca " - 19775 );
        spellput(
" cai " - 19774 );
        spellput(
" can " - 19763 );
        spellput(
" cang " - 19756 );
        spellput(
" cao " - 19751 );
        spellput(
" ce " - 19746 );
        spellput(
" ceng " - 19741 );
        spellput(
" cha " - 19739 );
        spellput(
" chai " - 19728 );
        spellput(
" chan " - 19725 );
        spellput(
" chang " - 19715 );
        spellput(
" chao " - 19540 );
        spellput(
" che " - 19531 );
        spellput(
" chen " - 19525 );
        spellput(
" cheng " - 19515 );
        spellput(
" chi " - 19500 );
        spellput(
" chong " - 19484 );
        spellput(
" chou " - 19479 );
        spellput(
" chu " - 19467 );
        spellput(
" chuai " - 19289 );
        spellput(
" chuan " - 19288 );
        spellput(
" chuang " - 19281 );
        spellput(
" chui " - 19275 );
        spellput(
" chun " - 19270 );
        spellput(
" chuo " - 19263 );
        spellput(
" ci " - 19261 );
        spellput(
" cong " - 19249 );
        spellput(
" cou " - 19243 );
        spellput(
" cu " - 19242 );
        spellput(
" cuan " - 19238 );
        spellput(
" cui " - 19235 );
        spellput(
" cun " - 19227 );
        spellput(
" cuo " - 19224 );
        spellput(
" da " - 19218 );
        spellput(
" dai " - 19212 );
        spellput(
" dan " - 19038 );
        spellput(
" dang " - 19023 );
        spellput(
" dao " - 19018 );
        spellput(
" de " - 19006 );
        spellput(
" deng " - 19003 );
        spellput(
" di " - 18996 );
        spellput(
" dian " - 18977 );
        spellput(
" diao " - 18961 );
        spellput(
" die " - 18952 );
        spellput(
" ding " - 18783 );
        spellput(
" diu " - 18774 );
        spellput(
" dong " - 18773 );
        spellput(
" dou " - 18763 );
        spellput(
" du " - 18756 );
        spellput(
" duan " - 18741 );
        spellput(
" dui " - 18735 );
        spellput(
" dun " - 18731 );
        spellput(
" duo " - 18722 );
        spellput(
" e " - 18710 );
        spellput(
" en " - 18697 );
        spellput(
" er " - 18696 );
        spellput(
" fa " - 18526 );
        spellput(
" fan " - 18518 );
        spellput(
" fang " - 18501 );
        spellput(
" fei " - 18490 );
        spellput(
" fen " - 18478 );
        spellput(
" feng " - 18463 );
        spellput(
" fo " - 18448 );
        spellput(
" fou " - 18447 );
        spellput(
" fu " - 18446 );
        spellput(
" ga " - 18239 );
        spellput(
" gai " - 18237 );
        spellput(
" gan " - 18231 );
        spellput(
" gang " - 18220 );
        spellput(
" gao " - 18211 );
        spellput(
" ge " - 18201 );
        spellput(
" gei " - 18184 );
        spellput(
" gen " - 18183 );
        spellput(
" geng " - 18181 );
        spellput(
" gong " - 18012 );
        spellput(
" gou " - 17997 );
        spellput(
" gu " - 17988 );
        spellput(
" gua " - 17970 );
        spellput(
" guai " - 17964 );
        spellput(
" guan " - 17961 );
        spellput(
" guang " - 17950 );
        spellput(
" gui " - 17947 );
        spellput(
" gun " - 17931 );
        spellput(
" guo " - 17928 );
        spellput(
" ha " - 17922 );
        spellput(
" hai " - 17759 );
        spellput(
" han " - 17752 );
        spellput(
" hang " - 17733 );
        spellput(
" hao " - 17730 );
        spellput(
" he " - 17721 );
        spellput(
" hei " - 17703 );
        spellput(
" hen " - 17701 );
        spellput(
" heng " - 17697 );
        spellput(
" hong " - 17692 );
        spellput(
" hou " - 17683 );
        spellput(
" hu " - 17676 );
        spellput(
" hua " - 17496 );
        spellput(
" huai " - 17487 );
        spellput(
" huan " - 17482 );
        spellput(
" huang " - 17468 );
        spellput(
" hui " - 17454 );
        spellput(
" hun " - 17433 );
        spellput(
" huo " - 17427 );
        spellput(
" ji " - 17417 );
        spellput(
" jia " - 17202 );
        spellput(
" jian " - 17185 );
        spellput(
" jiang " - 16983 );
        spellput(
" jiao " - 16970 );
        spellput(
" jie " - 16942 );
        spellput(
" jin " - 16915 );
        spellput(
" jing " - 16733 );
        spellput(
" jiong " - 16708 );
        spellput(
" jiu " - 16706 );
        spellput(
" ju " - 16689 );
        spellput(
" juan " - 16664 );
        spellput(
" jue " - 16657 );
        spellput(
" jun " - 16647 );
        spellput(
" ka " - 16474 );
        spellput(
" kai " - 16470 );
        spellput(
" kan " - 16465 );
        spellput(
" kang " - 16459 );
        spellput(
" kao " - 16452 );
        spellput(
" ke " - 16448 );
        spellput(
" ken " - 16433 );
        spellput(
" keng " - 16429 );
        spellput(
" kong " - 16427 );
        spellput(
" kou " - 16423 );
        spellput(
" ku " - 16419 );
        spellput(
" kua " - 16412 );
        spellput(
" kuai " - 16407 );
        spellput(
" kuan " - 16403 );
        spellput(
" kuang " - 16401 );
        spellput(
" kui " - 16393 );
        spellput(
" kun " - 16220 );
        spellput(
" kuo " - 16216 );
        spellput(
" la " - 16212 );
        spellput(
" lai " - 16205 );
        spellput(
" lan " - 16202 );
        spellput(
" lang " - 16187 );
        spellput(
" lao " - 16180 );
        spellput(
" le " - 16171 );
        spellput(
" lei " - 16169 );
        spellput(
" leng " - 16158 );
        spellput(
" li " - 16155 );
        spellput(
" lia " - 15959 );
        spellput(
" lian " - 15958 );
        spellput(
" liang " - 15944 );
        spellput(
" liao " - 15933 );
        spellput(
" lie " - 15920 );
        spellput(
" lin " - 15915 );
        spellput(
" ling " - 15903 );
        spellput(
" liu " - 15889 );
        spellput(
" long " - 15878 );
        spellput(
" lou " - 15707 );
        spellput(
" lu " - 15701 );
        spellput(
" lv " - 15681 );
        spellput(
" luan " - 15667 );
        spellput(
" lue " - 15661 );
        spellput(
" lun " - 15659 );
        spellput(
" luo " - 15652 );
        spellput(
" ma " - 15640 );
        spellput(
" mai " - 15631 );
        spellput(
" man " - 15625 );
        spellput(
" mang " - 15454 );
        spellput(
" mao " - 15448 );
        spellput(
" me " - 15436 );
        spellput(
" mei " - 15435 );
        spellput(
" men " - 15419 );
        spellput(
" meng " - 15416 );
        spellput(
" mi " - 15408 );
        spellput(
" mian " - 15394 );
        spellput(
" miao " - 15385 );
        spellput(
" mie " - 15377 );
        spellput(
" min " - 15375 );
        spellput(
" ming " - 15369 );
        spellput(
" miu " - 15363 );
        spellput(
" mo " - 15362 );
        spellput(
" mou " - 15183 );
        spellput(
" mu " - 15180 );
        spellput(
" na " - 15165 );
        spellput(
" nai " - 15158 );
        spellput(
" nan " - 15153 );
        spellput(
" nang " - 15150 );
        spellput(
" nao " - 15149 );
        spellput(
" ne " - 15144 );
        spellput(
" nei " - 15143 );
        spellput(
" nen " - 15141 );
        spellput(
" neng " - 15140 );
        spellput(
" ni " - 15139 );
        spellput(
" nian " - 15128 );
        spellput(
" niang " - 15121 );
        spellput(
" niao " - 15119 );
        spellput(
" nie " - 15117 );
        spellput(
" nin " - 15110 );
        spellput(
" ning " - 15109 );
        spellput(
" niu " - 14941 );
        spellput(
" nong " - 14937 );
        spellput(
" nu " - 14933 );
        spellput(
" nv " - 14930 );
        spellput(
" nuan " - 14929 );
        spellput(
" nue " - 14928 );
        spellput(
" nuo " - 14926 );
        spellput(
" o " - 14922 );
        spellput(
" ou " - 14921 );
        spellput(
" pa " - 14914 );
        spellput(
" pai " - 14908 );
        spellput(
" pan " - 14902 );
        spellput(
" pang " - 14894 );
        spellput(
" pao " - 14889 );
        spellput(
" pei " - 14882 );
        spellput(
" pen " - 14873 );
        spellput(
" peng " - 14871 );
        spellput(
" pi " - 14857 );
        spellput(
" pian " - 14678 );
        spellput(
" piao " - 14674 );
        spellput(
" pie " - 14670 );
        spellput(
" pin " - 14668 );
        spellput(
" ping " - 14663 );
        spellput(
" po " - 14654 );
        spellput(
" pu " - 14645 );
        spellput(
" qi " - 14630 );
        spellput(
" qia " - 14594 );
        spellput(
" qian " - 14429 );
        spellput(
" qiang " - 14407 );
        spellput(
" qiao " - 14399 );
        spellput(
" qie " - 14384 );
        spellput(
" qin " - 14379 );
        spellput(
" qing " - 14368 );
        spellput(
" qiong " - 14355 );
        spellput(
" qiu " - 14353 );
        spellput(
" qu " - 14345 );
        spellput(
" quan " - 14170 );
        spellput(
" que " - 14159 );
        spellput(
" qun " - 14151 );
        spellput(
" ran " - 14149 );
        spellput(
" rang " - 14145 );
        spellput(
" rao " - 14140 );
        spellput(
" re " - 14137 );
        spellput(
" ren " - 14135 );
        spellput(
" reng " - 14125 );
        spellput(
" ri " - 14123 );
        spellput(
" rong " - 14122 );
        spellput(
" rou " - 14112 );
        spellput(
" ru " - 14109 );
        spellput(
" ruan " - 14099 );
        spellput(
" rui " - 14097 );
        spellput(
" run " - 14094 );
        spellput(
" ruo " - 14092 );
        spellput(
" sa " - 14090 );
        spellput(
" sai " - 14087 );
        spellput(
" san " - 14083 );
        spellput(
" sang " - 13917 );
        spellput(
" sao " - 13914 );
        spellput(
" se " - 13910 );
        spellput(
" sen " - 13907 );
        spellput(
" seng " - 13906 );
        spellput(
" sha " - 13905 );
        spellput(
" shai " - 13896 );
        spellput(
" shan " - 13894 );
        spellput(
" shang " - 13878 );
        spellput(
" shao " - 13870 );
        spellput(
" she " - 13859 );
        spellput(
" shen " - 13847 );
        spellput(
" sheng " - 13831 );
        spellput(
" shi " - 13658 );
        spellput(
" shou " - 13611 );
        spellput(
" shu " - 13601 );
        spellput(
" shua " - 13406 );
        spellput(
" shuai " - 13404 );
        spellput(
" shuan " - 13400 );
        spellput(
" shuang " - 13398 );
        spellput(
" shui " - 13395 );
        spellput(
" shun " - 13391 );
        spellput(
" shuo " - 13387 );
        spellput(
" si " - 13383 );
        spellput(
" song " - 13367 );
        spellput(
" sou " - 13359 );
        spellput(
" su " - 13356 );
        spellput(
" suan " - 13343 );
        spellput(
" sui " - 13340 );
        spellput(
" sun " - 13329 );
        spellput(
" suo " - 13326 );
        spellput(
" ta " - 13318 );
        spellput(
" tai " - 13147 );
        spellput(
" tan " - 13138 );
        spellput(
" tang " - 13120 );
        spellput(
" tao " - 13107 );
        spellput(
" te " - 13096 );
        spellput(
" teng " - 13095 );
        spellput(
" ti " - 13091 );
        spellput(
" tian " - 13076 );
        spellput(
" tiao " - 13068 );
        spellput(
" tie " - 13063 );
        spellput(
" ting " - 13060 );
        spellput(
" tong " - 12888 );
        spellput(
" tou " - 12875 );
        spellput(
" tu " - 12871 );
        spellput(
" tuan " - 12860 );
        spellput(
" tui " - 12858 );
        spellput(
" tun " - 12852 );
        spellput(
" tuo " - 12849 );
        spellput(
" wa " - 12838 );
        spellput(
" wai " - 12831 );
        spellput(
" wan " - 12829 );
        spellput(
" wang " - 12812 );
        spellput(
" wei " - 12802 );
        spellput(
" wen " - 12607 );
        spellput(
" weng " - 12597 );
        spellput(
" wo " - 12594 );
        spellput(
" wu " - 12585 );
        spellput(
" xi " - 12556 );
        spellput(
" xia " - 12359 );
        spellput(
" xian " - 12346 );
        spellput(
" xiang " - 12320 );
        spellput(
" xiao " - 12300 );
        spellput(
" xie " - 12120 );
        spellput(
" xin " - 12099 );
        spellput(
" xing " - 12089 );
        spellput(
" xiong " - 12074 );
        spellput(
" xiu " - 12067 );
        spellput(
" xu " - 12058 );
        spellput(
" xuan " - 12039 );
        spellput(
" xue " - 11867 );
        spellput(
" xun " - 11861 );
        spellput(
" ya " - 11847 );
        spellput(
" yan " - 11831 );
        spellput(
" yang " - 11798 );
        spellput(
" yao " - 11781 );
        spellput(
" ye " - 11604 );
        spellput(
" yi " - 11589 );
        spellput(
" yin " - 11536 );
        spellput(
" ying " - 11358 );
        spellput(
" yo " - 11340 );
        spellput(
" yong " - 11339 );
        spellput(
" you " - 11324 );
        spellput(
" yu " - 11303 );
        spellput(
" yuan " - 11097 );
        spellput(
" yue " - 11077 );
        spellput(
" yun " - 11067 );
        spellput(
" za " - 11055 );
        spellput(
" zai " - 11052 );
        spellput(
" zan " - 11045 );
        spellput(
" zang " - 11041 );
        spellput(
" zao " - 11038 );
        spellput(
" ze " - 11024 );
        spellput(
" zei " - 11020 );
        spellput(
" zen " - 11019 );
        spellput(
" zeng " - 11018 );
        spellput(
" zha " - 11014 );
        spellput(
" zhai " - 10838 );
        spellput(
" zhan " - 10832 );
        spellput(
" zhang " - 10815 );
        spellput(
" zhao " - 10800 );
        spellput(
" zhe " - 10790 );
        spellput(
" zhen " - 10780 );
        spellput(
" zheng " - 10764 );
        spellput(
" zhi " - 10587 );
        spellput(
" zhong " - 10544 );
        spellput(
" zhou " - 10533 );
        spellput(
" zhu " - 10519 );
        spellput(
" zhua " - 10331 );
        spellput(
" zhuai " - 10329 );
        spellput(
" zhuan " - 10328 );
        spellput(
" zhuang " - 10322 );
        spellput(
" zhui " - 10315 );
        spellput(
" zhun " - 10309 );
        spellput(
" zhuo " - 10307 );
        spellput(
" zi " - 10296 );
        spellput(
" zong " - 10281 );
        spellput(
" zou " - 10274 );
        spellput(
" zu " - 10270 );
        spellput(
" zuan " - 10262 );
        spellput(
" zui " - 10260 );
        spellput(
" zun " - 10256 );
        spellput(
" zuo " - 10254 );
    }

    
/**
     * 获得单个汉字的ascii.
     * 
@param  cn char
     * 汉字字符
     * 
@return  int
     * 错误返回 0,否则返回ascii
     
*/
    
public   static   int  getcnascii( char  cn) {
        
byte [] bytes  =  (string.valueof(cn)).getbytes();
        
if  (bytes  ==   null   ||  bytes.length  >   2   ||  bytes.length  <=   0 ) {  // 错误
             return   0 ;
        }
        
if  (bytes.length  ==   1 ) {  // 英文字符
             return  bytes[ 0 ];
        }
        
if  (bytes.length  ==   2 ) {  // 中文字符
             int  hightbyte  =   256    bytes[ 0 ];
            
int  lowbyte  =   256    bytes[ 1 ];

            
int  ascii  =  ( 256   *  hightbyte   lowbyte)  -   256   *   256 ;

// system.out.println("ascii="   ascii);

            
return  ascii;
        }

        
return   0 // 错误
    }

    
/**
     * 根据ascii码到spellmap中查找对应的拼音
     * 
@param  ascii int
     * 字符对应的ascii
     * 
@return  string
     * 拼音,首先判断ascii是否>0&<160,如果是返回对应的字符,
     *
     否则到spellmap中查找,如果没有找到拼音,则返回null,如果找到则返回拼音.
     
*/
    
public   static  string getspellbyascii( int  ascii) {
        
if  (ascii  >   0   &&  ascii  <   160 ) {  // 单字符
             return  string.valueof(( char ) ascii);
        }

        
if  (ascii  <   - 20319   ||  ascii  >   - 10247 ) {  // 不知道的字符
             return   null ;
        }

        set keyset 
=  spellmap.keyset();
        iterator it 
=  keyset.iterator();

        string spell0 
=   null ; ;
        string spell 
=   null ;

        
int  asciirang0  =   - 20319 ;
        
int  asciirang;
        
while  (it.hasnext()) {

            spell 
=  (string) it.next();
            object valobj 
=  spellmap.get(spell);
            
if  (valobj  instanceof  integer) {
                asciirang 
=  ((integer) valobj).intvalue();

                
if  (ascii  >=  asciirang0  &&  ascii  <  asciirang) {  // 区间找到
                     return  (spell0  ==   null ?  spell : spell0;
                } 
else  {
                    spell0 
=  spell;
                    asciirang0 
=  asciirang;
                }
            }
        }

        
return   null ;

    }

    
/**
     * 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换
     * 
@param  cnstr string
     * 字符串
     * 
@return  string
     * 转换成全拼后的字符串
     
*/
    
public   static  string getfullspell(string cnstr) {
        
if  ( null   ==  cnstr  ||   "" .equals(cnstr.trim())) {
            
return  cnstr;
        }

        
char [] chars  =  cnstr.tochararray();
        stringbuffer retubuf 
=   new  stringbuffer();
        
for  ( int  i  =   0 , len  =  chars.length; i  <  len; i ) {
            
int  ascii  =  getcnascii(chars[i]);
            
if  (ascii  ==   0 ) {  // 取ascii时出错
                retubuf.append(chars[i]);
            } 
else  {
                string spell 
=  getspellbyascii(ascii);
                
if  (spell  ==   null ) {
                    retubuf.append(chars[i]);
                } 
else  {
                    retubuf.append(spell);
                } 
//  end of if spell == null
            }  //  end of if ascii <= -20400
        }  //  end of for

        
return  retubuf.tostring();
    }

    
public   static  string getfirstspell(string cnstr) {
        
return   null ;
    }

    
public   static   void  main(string[] args) {
        string str 
=   null ;
        str 
=   " 小红帽 " ;
        system.out.println(
" spell= "    cntospell.getfullspell(str));  }
}
posted on 2006-11-02 12:11 芦苇 阅读(7628) 评论(12)  编辑  收藏

feedback

# re: java实现汉字转换为拼音 2006-11-24 15:06 芦苇
java将汉字转化成拼音的方法
/** *//**
#############################################################################
# describe 将汉字转化成拼音
# date 2006-7-12
# company flx
# porject java
#############################################################################
*/
import java.util.iterator;
import java.util.linkedhashmap;
import java.util.set;

public class cntospell ...{
private static linkedhashmap spellmap = null;

static ...{
if (spellmap == null) ...{
spellmap = new linkedhashmap(400);
}
initialize();
system.out.println("chinese transfer spell done.");
}

private cntospell() ...{
}

/** *//**
* 获得单个汉字的ascii.
* @param cn char
* 汉字字符
* @return int
* 错误返回 0,否则返回ascii
*/
public static int getcnascii(char cn) ...{
byte[] bytes = (string.valueof(cn)).getbytes();
if (bytes == null || bytes.length > 2 || bytes.length <= 0) ...{ //错误
return 0;
}
if (bytes.length == 1) ...{ //英文字符
return bytes[0];
}
if (bytes.length == 2) ...{ //中文字符
int hightbyte = 256 bytes[0];
int lowbyte = 256 bytes[1];
int ascii = (256 * hightbyte lowbyte) - 256 * 256;
return ascii;
}
return 0; //错误
}

/** *//**
* 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换
* @param cnstr string
* 字符串
* @return string
* 转换成全拼后的字符串
*/
public static string getfullspell(string cnstr) ...{
if (null == cnstr || "".equals(cnstr.trim())) ...{
return cnstr;
}

char[] chars = cnstr.tochararray();
stringbuffer retubuf = new stringbuffer();
for (int i = 0, len = chars.length; i < len; i ) ...{
int ascii = getcnascii(chars[i]);
if (ascii == 0) ...{ //取ascii时出错
retubuf.append(chars[i]);
} else ...{
string spell = getspellbyascii(ascii);
if (spell == null) ...{
retubuf.append(chars[i]);
} else ...{
retubuf.append(spell);
} // end of if spell == null
} // end of if ascii <= -20400
} // end of for

return retubuf.tostring();
}

/** *//**
* 根据ascii码到spellmap中查找对应的拼音
* @param ascii int
* 字符对应的ascii
* @return string
* 拼音,首先判断ascii是否>0&<160,如果是返回对应的字符,
*
否则到spellmap中查找,如果没有找到拼音,则返回null,如果找到则返回拼音.
*/
public static string getspellbyascii(int ascii) ...{
if (ascii > 0 && ascii < 160) ...{ //单字符
return string.valueof((char) ascii);
}

if (ascii < -20319 || ascii > -10247) ...{ //不知道的字符
return null;
}

set keyset = spellmap.keyset();
iterator it = keyset.iterator();

string spell0 = null;
;
string spell = null;

int asciirang0 = -20319;
int asciirang;
while (it.hasnext()) ...{

spell = (string) it.next();
object valobj = spellmap.get(spell);
if (valobj instanceof integer) ...{
asciirang = ((integer) valobj).intvalue();

if (ascii >= asciirang0 && ascii < asciirang) ...{ //区间找到
return (spell0 == null) ? spell : spell0;
} else ...{
spell0 = spell;
asciirang0 = asciirang;
}
}
}

return null;

}

private static void initialize() ...{
spellput("a", -20319);
spellput("ai", -20317);
spellput("an", -20304);
spellput("ang", -20295);
spellput("ao", -20292);
spellput("ba", -20283);
spellput("bai", -20265);
spellput("ban", -20257);
spellput("bang", -20242);
spellput("bao", -20230);
spellput("bei", -20051);
spellput("ben", -20036);
spellput("beng", -20032);
spellput("bi", -20026);
spellput("bian", -20002);
spellput("biao", -19990);
spellput("bie", -19986);
spellput("bin", -19982);
spellput("bing", -19976);
spellput("bo", -19805);
spellput("bu", -19784);
spellput("ca", -19775);
spellput("cai", -19774);
spellput("can", -19763);
spellput("cang", -19756);
spellput("cao", -19751);
spellput("ce", -19746);
spellput("ceng", -19741);
spellput("cha", -19739);
spellput("chai", -19728);
spellput("chan", -19725);
spellput("chang", -19715);
spellput("chao", -19540);
spellput("che", -19531);
spellput("chen", -19525);
spellput("cheng", -19515);
spellput("chi", -19500);
spellput("chong", -19484);
spellput("chou", -19479);
spellput("chu", -19467);
spellput("chuai", -19289);
spellput("chuan", -19288);
spellput("chuang", -19281);
spellput("chui", -19275);
spellput("chun", -19270);
spellput("chuo", -19263);
spellput("ci", -19261);
spellput("cong", -19249);
spellput("cou", -19243);
spellput("cu", -19242);
spellput("cuan", -19238);
spellput("cui", -19235);
spellput("cun", -19227);
spellput("cuo", -19224);
spellput("da", -19218);
spellput("dai", -19212);
spellput("dan", -19038);
spellput("dang", -19023);
spellput("dao", -19018);
spellput("de", -19006);
spellput("deng", -19003);
spellput("di", -18996);
spellput("dian", -18977);
spellput("diao", -18961);
spellput("die", -18952);
spellput("ding", -18783);
spellput("diu", -18774);
spellput("dong", -18773);
spellput("dou", -18763);
spellput("du", -18756);
spellput("duan", -18741);
spellput("dui", -18735);
spellput("dun", -18731);
spellput("duo", -18722);
spellput("e", -18710);
spellput("en", -18697);
spellput("er", -18696);
spellput("fa", -18526);
spellput("fan", -18518);
spellput("fang", -18501);
spellput("fei", -18490);
spellput("fen", -18478);
spellput("feng", -18463);
spellput("fo", -18448);
spellput("fou", -18447);
spellput("fu", -18446);
spellput("ga", -18239);
spellput("gai", -18237);
spellput("gan", -18231);
spellput("gang", -18220);
spellput("gao", -18211);
spellput("ge", -18201);
spellput("gei", -18184);
spellput("gen", -18183);
spellput("geng", -18181);
spellput("gong", -18012);
spellput("gou", -17997);
spellput("gu", -17988);
spellput("gua", -17970);
spellput("guai", -17964);
spellput("guan", -17961);
spellput("guang", -17950);
spellput("gui", -17947);
spellput("gun", -17931);
spellput("guo", -17928);
spellput("ha", -17922);
spellput("hai", -17759);
spellput("han", -17752);
spellput("hang", -17733);
spellput("hao", -17730);
spellput("he", -17721);
spellput("hei", -17703);
spellput("hen", -17701);
spellput("heng", -17697);
spellput("hong", -17692);
spellput("hou", -17683);
spellput("hu", -17676);
spellput("hua", -17496);
spellput("huai", -17487);
spellput("huan", -17482);
spellput("huang", -17468);
spellput("hui", -17454);
spellput("hun", -17433);
spellput("huo", -17427);
spellput("ji", -17417);
spellput("jia", -17202);
spellput("jian", -17185);
spellput("jiang", -16983);
spellput("jiao", -16970);
spellput("jie", -16942);
spellput("jin", -16915);
spellput("jing", -16733);
spellput("jiong", -16708);
spellput("jiu", -16706);
spellput("ju", -16689);
spellput("juan", -16664);
spellput("jue", -16657);
spellput("jun", -16647);
spellput("ka", -16474);
spellput("kai", -16470);
spellput("kan", -16465);
spellput("kang", -16459);
spellput("kao", -16452);
spellput("ke", -16448);
spellput("ken", -16433);
spellput("keng", -16429);
spellput("kong", -16427);
spellput("kou", -16423);
spellput("ku", -16419);
spellput("kua", -16412);
spellput("kuai", -16407);
spellput("kuan", -16403);
spellput("kuang", -16401);
spellput("kui", -16393);
spellput("kun", -16220);
spellput("kuo", -16216);
spellput("la", -16212);
spellput("lai", -16205);
spellput("lan", -16202);
spellput("lang", -16187);
spellput("lao", -16180);
spellput("le", -16171);
spellput("lei", -16169);
spellput("leng", -16158);
spellput("li", -16155);
spellput("lia", -15959);
spellput("lian", -15958);
spellput("liang", -15944);
spellput("liao", -15933);
spellput("lie", -15920);
spellput("lin", -15915);
spellput("ling", -15903);
spellput("liu", -15889);
spellput("long", -15878);
spellput("lou", -15707);
spellput("lu", -15701);
spellput("lv", -15681);
spellput("luan", -15667);
spellput("lue", -15661);
spellput("lun", -15659);
spellput("luo", -15652);
spellput("ma", -15640);
spellput("mai", -15631);
spellput("man", -15625);
spellput("mang", -15454);
spellput("mao", -15448);
spellput("me", -15436);
spellput("mei", -15435);
spellput("men", -15419);
spellput("meng", -15416);
spellput("mi", -15408);
spellput("mian", -15394);
spellput("miao", -15385);
spellput("mie", -15377);
spellput("min", -15375);
spellput("ming", -15369);
spellput("miu", -15363);
spellput("mo", -15362);
spellput("mou", -15183);
spellput("mu", -15180);
spellput("na", -15165);
spellput("nai", -15158);
spellput("nan", -15153);
spellput("nang", -15150);
spellput("nao", -15149);
spellput("ne", -15144);
spellput("nei", -15143);
spellput("nen", -15141);
spellput("neng", -15140);
spellput("ni", -15139);
spellput("nian", -15128);
spellput("niang", -15121);
spellput("niao", -15119);
spellput("nie", -15117);
spellput("nin", -15110);
spellput("ning", -15109);
spellput("niu", -14941);
spellput("nong", -14937);
spellput("nu", -14933);
spellput("nv", -14930);
spellput("nuan", -14929);
spellput("nue", -14928);
spellput("nuo", -14926);
spellput("o", -14922);
spellput("ou", -14921);
spellput("pa", -14914);
spellput("pai", -14908);
spellput("pan", -14902);
spellput("pang", -14894);
spellput("pao", -14889);
spellput("pei", -14882);
spellput("pen", -14873);
spellput("peng", -14871);
spellput("pi", -14857);
spellput("pian", -14678);
spellput("piao", -14674);
spellput("pie", -14670);
spellput("pin", -14668);
spellput("ping", -14663);
spellput("po", -14654);
spellput("pu", -14645);
spellput("qi", -14630);
spellput("qia", -14594);
spellput("qian", -14429);
spellput("qiang", -14407);
spellput("qiao", -14399);
spellput("qie", -14384);
spellput("qin", -14379);
spellput("qing", -14368);
spellput("qiong", -14355);
spellput("qiu", -14353);
spellput("qu", -14345);
spellput("quan", -14170);
spellput("que", -14159);
spellput("qun", -14151);
spellput("ran", -14149);
spellput("rang", -14145);
spellput("rao", -14140);
spellput("re", -14137);
spellput("ren", -14135);
spellput("reng", -14125);
spellput("ri", -14123);
spellput("rong", -14122);
spellput("rou", -14112);
spellput("ru", -14109);
spellput("ruan", -14099);
spellput("rui", -14097);
spellput("run", -14094);
spellput("ruo", -14092);
spellput("sa", -14090);
spellput("sai", -14087);
spellput("san", -14083);
spellput("sang", -13917);
spellput("sao", -13914);
spellput("se", -13910);
spellput("sen", -13907);
spellput("seng", -13906);
spellput("sha", -13905);
spellput("shai", -13896);
spellput("shan", -13894);
spellput("shang", -13878);
spellput("shao", -13870);
spellput("she", -13859);
spellput("shen", -13847);
spellput("sheng", -13831);
spellput("shi", -13658);
spellput("shou", -13611);
spellput("shu", -13601);
spellput("shua", -13406);
spellput("shuai", -13404);
spellput("shuan", -13400);
spellput("shuang", -13398);
spellput("shui", -13395);
spellput("shun", -13391);
spellput("shuo", -13387);
spellput("si", -13383);
spellput("song", -13367);
spellput("sou", -13359);
spellput("su", -13356);
spellput("suan", -13343);
spellput("sui", -13340);
spellput("sun", -13329);
spellput("suo", -13326);
spellput("ta", -13318);
spellput("tai", -13147);
spellput("tan", -13138);
spellput("tang", -13120);
spellput("tao", -13107);
spellput("te", -13096);
spellput("teng", -13095);
spellput("ti", -13091);
spellput("tian", -13076);
spellput("tiao", -13068);
spellput("tie", -13063);
spellput("ting", -13060);
spellput("tong", -12888);
spellput("tou", -12875);
spellput("tu", -12871);
spellput("tuan", -12860);
spellput("tui", -12858);
spellput("tun", -12852);
spellput("tuo", -12849);
spellput("wa", -12838);
spellput("wai", -12831);
spellput("wan", -12829);
spellput("wang", -12812);
spellput("wei", -12802);
spellput("wen", -12607);
spellput("weng", -12597);
spellput("wo", -12594);
spellput("wu", -12585);
spellput("xi", -12556);
spellput("xia", -12359);
spellput("xian", -12346);
spellput("xiang", -12320);
spellput("xiao", -12300);
spellput("xie", -12120);
spellput("xin", -12099);
spellput("xing", -12089);
spellput("xiong", -12074);
spellput("xiu", -12067);
spellput("xu", -12058);
spellput("xuan", -12039);
spellput("xue", -11867);
spellput("xun", -11861);
spellput("ya", -11847);
spellput("yan", -11831);
spellput("yang", -11798);
spellput("yao", -11781);
spellput("ye", -11604);
spellput("yi", -11589);
spellput("yin", -11536);
spellput("ying", -11358);
spellput("yo", -11340);
spellput("yong", -11339);
spellput("you", -11324);
spellput("yu", -11303);
spellput("yuan", -11097);
spellput("yue", -11077);
spellput("yun", -11067);
spellput("za", -11055);
spellput("zai", -11052);
spellput("zan", -11045);
spellput("zang", -11041);
spellput("zao", -11038);
spellput("ze", -11024);
spellput("zei", -11020);
spellput("zen", -11019);
spellput("zeng", -11018);
spellput("zha", -11014);
spellput("zhai", -10838);
spellput("zhan", -10832);
spellput("zhang", -10815);
spellput("zhao", -10800);
spellput("zhe", -10790);
spellput("zhen", -10780);
spellput("zheng", -10764);
spellput("zhi", -10587);
spellput("zhong", -10544);
spellput("zhou", -10533);
spellput("zhu", -10519);
spellput("zhua", -10331);
spellput("zhuai", -10329);
spellput("zhuan", -10328);
spellput("zhuang", -10322);
spellput("zhui", -10315);
spellput("zhun", -10309);
spellput("zhuo", -10307);
spellput("zi", -10296);
spellput("zong", -10281);
spellput("zou", -10274);
spellput("zu", -10270);
spellput("zuan", -10262);
spellput("zui", -10260);
spellput("zun", -10256);
spellput("zuo", -10254);
}

public static void main(string[] args) ...{
string str = null;
str = "谢海101普降喜雨";
system.out.println("spell=" cntospell.getfullspell(str));

str = "张牙舞爪》。,";
system.out.println("spell=" cntospell.getfullspell(str));

str = "啦啦,可耻下场。";
system.out.println("spell=" cntospell.getfullspell(str));

str = "猪油,猪八戒。";
system.out.println("spell=" cntospell.getfullspell(str));
}

private static void spellput(string spell, int ascii) ...{
spellmap.put(spell, new integer(ascii));
}
}  回复  
  

# re: java实现汉字转换为拼音 2006-11-24 15:08 芦苇
根据汉字得到拼音的类库(三)
///

/// 存放排好序的汉字-拼音对照字典,格式如下

/// 汉han

/// 字zi

/// 既汉字作为字典的key,拼音作为value

///


private sorteddictionary msortdiction = new sorteddictionary() ;



private static spelllib _instance ;



///

/// 取汉字拼音类的实例

///


///

public static spelllib instance()

{

if (_instance == null)

_instance = new spelllib();

return _instance;

}



///

/// 构造函数

///


private spelllib()

{

buildsortdiction();

}



#region 提供的方法

///

/// 把给定的字转化为拼音

///


/// 要转化的字

/// 字的拼音

///

/// string strcode = spelllib.instance().getcodesbyword('字');

///


/// 如果该字不存在拼音,就返回该字本身

public string getcodebyword(char word)

{

if (msortdiction.containskey(word))

return msortdiction[word];

else

return word.tostring();

}

///

/// 取得字符串第一个字的拼音

///


/// 要转化的字符串

/// 字的拼音

///

/// string strcode = spelllib.instance().getcodesbyword("汉字");

///


/// 如果第一个字不存在拼音,就返回该字本身

public string getcodebyword(string word)

{

if (word == null)

throw new argumentnullexception("word");



if (word.length > 0)

return getcodebyword(word[0]);

else

return null;

}

///

/// 取得一个字符串中所有字的拼音

///


///

///

public string getcodesbyword(string sentence)

{

if (sentence == null)

throw new argumentnullexception("sentence");



bool bladdspace = false;

stringbuilder sbresult = new stringbuilder();



foreach (char chr in sentence)

{

string strcodes = getcodebyword(chr) ;



if (strcodes.length > 1)

{

if (bladdspace == false)

{

sbresult.append(" ");

}

sbresult.append(strcodes);

sbresult.append(" ");

bladdspace = true;

}

else

{

sbresult.append(strcodes);

bladdspace = false;

}

}

return sbresult.tostring();

}

///

/// 构造排序字典对象

///


private void buildsortdiction()

{

// msortdiction.

for (int i = 0; i < this.wordlist.length; i )

{

string value = this.codelist[i];

string strword = wordlist[i];



foreach (char key in strword)

{

if (msortdiction.containskey(key))

{

continue;

}

else

{

msortdiction.add(key, value);

}

}//end foreach



}//end for

}

///

/// 取得给定拼音的声母

///


/// 拼音

/// 声母

/// 如果不存在声母就返回第一个字母,如啊返回a,嗯返回e

public static string getvoicepart(string spell)

{

string strvoicepart = null;

if (spell.length == 1)

{

strvoicepart = spell;

}

else

{



char firstchr = spell[0];

char secondchr = spell[1];

strvoicepart = firstchr.tostring();

if (secondchr.equals('h') || secondchr.equals('h'))

strvoicepart = "h";



switch (strvoicepart.tolower(system.globalization.cultureinfo.currentculture))

{

case "b":

case "p":

case "m":

case "f":

case "d":

case "t":

case "n":

case "l":

case "g":

case "k":

case "h":

case "j":

case "q":

case "x":

case "r":

case "z":

case "c":

case "s":

case "zh":

case "ch":

case "sh":

break;

default:

strvoicepart = firstchr.tostring();

break;

}//end switch

}

return strvoicepart;

}

///

/// 取得给定汉字的声母部分

///


///

///

///

/// string strvoicepart = spelllib.instance().getcodeofvoicepart("字");

///


/// 如果不存在声母就返回第一个字母,如啊返回a,嗯返回e

public string getcodeofvoicepart(string word)

{

return getvoicepart(this.getcodebyword(word));

}

///

/// 取得给定汉字的声母部分

///


///

///

/// 如果不存在声母就返回第一个字母,如啊返回a,嗯返回e

public string getcodeofvoicepart(char word)

{

return getvoicepart(this.getcodebyword(word));

}

#endregion



}//end class



}//end namespace




trackback:
  回复  
  

# re: java实现汉字转换为拼音 2006-11-24 15:09 芦苇
c#的汉字转拼音
///
/// 获取一串汉字的拼音声母
///

/// unicode格式的汉字字符串
/// 拼音声母字符串
public static string convert(string chinese)
{
char[] buffer = new char[chinese.length];
for(int i=0; i{
buffer[i] = convert(chinese[i]);
}
return new string(buffer);
}

///
/// 获取一个汉字的拼音声母
///

/// unicode格式的一个汉字
/// 汉字的声母
public static char convert(char chinese)
{
encoding gb2312 = encoding.getencoding("gb2312");
encoding unicode = encoding.unicode;

// convert the string into a byte[].
byte[] unicodebytes = unicode.getbytes(new char[] {chinese});
// perform the conversion from one encoding to the other.
byte[] asciibytes = encoding.convert(unicode, gb2312, unicodebytes);

// 计算该汉字的gb-2312编码
int n = (int)asciibytes[0]<<8;
n = (int)asciibytes[1];

// 根据汉字区域码获取拼音声母
if (in(0xb0a1,0xb0c4,n)) return 'a';
if (in(0xb0c5,0xb2c0,n)) return 'b';
if (in(0xb2c1,0xb4ed,n)) return 'c';
if (in(0xb4ee,0xb6e9,n)) return 'd';
if (in(0xb6ea,0xb7a1,n)) return 'e';
if (in(0xb7a2,0xb8c0,n)) return 'f';
if (in(0xb8c1,0xb9fd,n)) return 'g';
if (in(0xb9fe,0xbbf6,n)) return 'h';
if (in(0xbbf7,0xbfa5,n)) return 'j';
if (in(0xbfa6,0xc0ab,n)) return 'k';
if (in(0xc0ac,0xc2e7,n)) return 'l';
if (in(0xc2e8,0xc4c2,n)) return 'm';
if (in(0xc4c3,0xc5b5,n)) return 'n';
if (in(0xc5b6,0xc5bd,n)) return 'o';
if (in(0xc5be,0xc6d9,n)) return 'p';
if (in(0xc6da,0xc8ba,n)) return 'q';
if (in(0xc8bb,0xc8f5,n)) return 'r';
if (in(0xc8f6,0xcbf0,n)) return 's';
if (in(0xcbfa,0xcdd9,n)) return 't';
if (in(0xcdda,0xcef3,n)) return 'w';
if (in(0xcef4,0xd188,n)) return 'x';
if (in(0xd1b9,0xd4d0,n)) return 'y';
if (in(0xd4d1,0xd7f9,n)) return 'z';
return '\0';
}

private static bool in(int lp, int hp, int value)
{
return ((value<=hp)&&(value>=lp));
}

转帖自7707(kingfisher)




trackback:

  回复  
  

# re: java实现汉字转换为拼音[未登录] 2007-11-15 19:40
转 “做” 试试看?  回复  
  

# re: java实现汉字转换为拼音 2007-11-28 19:43
清远同学  回复  
  

# re: java实现汉字转换为拼音 2007-11-29 22:31
坚强的太久好疲惫,想在爱的人怀里,静静的睡……我爱着你是寂静的,遥远而且忧伤……  回复  
  

# re: java实现汉字转换为拼音 2007-12-02 17:36
想回到过去  回复  
  

# re: java实现汉字转换为拼音[未登录] 2007-12-07 00:57
忘不了你 卓  回复  
  

# re: java实现汉字转换为英文 2007-12-08 16:12
陈海洋  回复  
  

# re: java实现汉字转换为拼音 2007-12-15 02:30
音乐
  回复  
  

# re: java实现汉字转换为拼音 2007-12-15 02:30
音乐  回复  
  

# 哈尔滨实现汉字转换为拼音 2008-07-21 19:45
转换字  回复  
  


只有注册用户后才能发表评论。


网站导航:
              
 
网站地图