第66号 2013.3.30発行 by 中村 公省
    簡体字を日本漢字に転換する奥の手 <目次>へ戻る
(1)PinConv+
 簡体字を日本漢字に転換するための工具はいろいろ存在するが、21世紀中国総研では、長年、中国語変換ツール「PinConv+」(www.karak.jp/chinese/)というフリーソフトに御厄介になってきた。簡体字をピンインに変換する機能や中日辞書の機能なども備えていて、なかなかの優れものである。(ここで「日本漢字」とはアバウトに、現代の常用漢字と常用漢字を除く日本での歴史的使用漢字を指す。)開発者は中国語翻訳者であるタケウチシンスケさん。この場を借りて厚く御礼申し上げたい。
 しかし、便利なものに慣れると欠陥も気になりだす。隴を得て蜀を望むの類である。
 この変換ツールでは、日本漢字はシフトJISコードをベースにしていて、簡体字→日本漢字の変換において、以下のような間に合わせの変換がなされる。

邓→[登β]   卡→[上/ト]   赣→[章[夂/貢]   闽→[門<虫]

 これを正しく訂正するには、手作業しかない。

邓→鄧   卡→[上/ト]   赣→贛   闽→閩

図1 Pincov+ (Jpn2Chnで日本漢字から簡体字に変換。Chn2Jpnで簡体字から日本漢字に変換)

  人名とか、地名とかの固有名詞になると、その数は大変なものになり、いちいち訂正するのに大変な労力と時間を要する。そこで21世紀中国総研で編み出したのが、シェアウエアのテキストエディタであるEmEditor(http://jp.emeditor.com/)のマクロを使った一括補正置換である。PinConv+で簡体字を日本漢字に変換したものを、EmEditorに貼り付け直して、不正確なものを正しい日本漢字に訂正し直す。1対1の検索置換ではなく、マクロ機能を使った多数一括・検索置換である、その方法については『中国情報源』2010-2011年版で紹介したので、ここでは繰り返さない(拙稿「正規表現によるコピペ中国情報データ整理術」)。この補正的な一括検索・置換は奏功して、「PinConv+」の間違い、至らない点を発見するたびに追加するうちに、90%以上の正解率を上げている。むろん、100%の正解は端から期待できない。例えば、
发→髪 あるいは 発(发展は発展、髪の毛の場合は髪)
沈→瀋 あるいは 沈(沈陽は瀋陽、人名の場合は沈)
というように、複数の選択肢があって、文章の前後の意味文脈から判断するしかない事例が多数あるからである。すなわち、簡体字→日本字変換においては目視確認作業を絶対に欠かすことができない。しかし、目視確認作業はできるだけ軽減したい、せめて単純に1対1で対応している簡体字と日本漢字の変換は、パーフェクトにできて欲しいという願望は捨てきれないできた。

(2)PinConv4
 2010年にPinConv+がバージョンアップされた。PinConv4 (http://www.karak.jp/chinese/pinconv-4-00.html)である。シェアウエアで、個人的に利用する限りではフリーということである。
 自己紹介に、「Pinconvは、漢字をピンインに変換したり、簡体字を日本の漢字に変換したり、簡体字を繁体字に変換したりするツールです」とある。PinConv+と較べて格段と機能が強化されている。①複数パターンの高速一括変換②翻訳作業をサポートする多彩な機能③多言語対応エディタ④豊富な検索機能がうたわれている。なかでもUnicodeに対応していることが大きく、EUC-JPやシフトJIS、UTF-8やGB2312、BIG5など複数の文字コードでのファイルの読み書きができる。明らかにPinConv+より格段と優れた漢字変換ソフトで、開発者に「ありがとう」と感謝したい。
 PinConv4の初期画面は図2のごとくである。

図2 PinConv4の初期画面

 さっそく、図3(A)のように邓小平がある中文を貼り付けて、簡体字→日本字変換である左端の「中日」ボタンをクリックしてみると、あれ?

図3 PinConv4 (A)簡体字から日本漢字への変換例と(B)簡体字→繁体字→簡体字への2段階変換例

 邓小平はdeng小平と変換されている。
PinConv+ では邓小平は[登β]小平と変換されていたが、PinConv4では[登β]をピンインdengに置き換えたにすぎない。先にあげた卡、赣、闽の場合も同様である。

卡→ka   赣→gan   闽→min

 何故、素直に鄧小平とならないのか?
 鄧小平だけではないようだ。「无产阶级」が正しく「無産階級」とならずに、「无産階級」となり、「无」が「无」のままである。何故か? これは「无」が日本漢字の中にあるからであろう。このコンバータは漢字の1対1の対応で変換していて、「无产」とか「无产阶级」とかいう単語単位で、意味を参照して変換していない。
 改めて、PinConv4の初期画面をにらんでみて、気が付いた。左端の「中日」ボタンから右に順番に、①「中日」②「日中」③「簡繁」④「繁簡」⑤「ピンイン」⑥「声調」⑦「繁日」⑧「日簡」と8つのボタンが並んでいる。このうち⑤「ピンイン」⑥「声調」を除く6つが日中の漢字変換ボタンである。これをうまく組み合わせれば、簡体字→日本漢字の変換ができるのではないか。まず、③「簡繁」で簡体字を繁体字に直して、さらに⑦「繁日」で繁体字を日本漢字に変換すればどうか。
 その2段階変換を試したのが、図3の(B)である。結果として、邓小平は鄧小平に正しく変換された。無産階級も正しく無産階級となっている。この事例の限りでは、パーフェクトである。
 これは、使い甲斐がある! 
 しかし、2段階変換というのは、いかがなものか。2段階変換を経る間に、別の思わぬ問題が発生することも考えらなくもない。不安が残る。少なくとも、
邬→鄔  炜→煒  玮→瑋 などはそれぞれ 邬→〓  炜→〓  玮→〓
という具合に〓(ゲタ)をはいて出てくる。

 一発での単純変換を望まずにはおれない。
(3) 簡体字と日本語漢字の相互変換ツールKanconvit をEmEditor のマクロに組みこむ
 さきにEmEditor(http://jp.emeditor.com/)を紹介したが、ある時、偶然に「EmEditor (テキストエディタ) フォーラム」に、図3のようなQ&Aを見つけた(2010年5月のQ&A)。

図4 EmEditor サイトのQ&A

 質問のポイントは、2点からなる。
①簡体字と日本語漢字の相互変換ツール Kanconvit (JavaScript)が公開されている。
http://blog.livedoor.jp/dankogai/archives/51224227.html
Kanconvit は「カンコンビット」と読むようである。開発者は弾さん(dankogai)。プログラマーらしく、漢字とか中国の専門家とかではなさそうである。文字コードは UTF-8 で統一してある。
②このKanconvit をテキストエディタEmEditor のマクロに組み込む方法を教えて欲しい。
 この②の質問に答えているのが、EmEditor 開発者の江村豊さんである。
方法は、ごく簡単のよう見えた。
 しかし、「一番やさしいJAVA入門」に挑戦して跳ね返された、己れの経験が気になる。チャレンジしてみたが、案の定、立往生を余儀なくされた。ここに紹介されている情報には、プログラマーにとって常識になっていることが、行間に散りばめられているようで、素人には見当がつかない。他愛もないところでつかえ、ついにギブアップした。
 21世紀中国総研顧問・西出雅先生の教えを乞うと、「はい、できましたよ」。しかし、簡体字→日本漢字はできても、もう一方の日本漢字→簡体字ができないではないか? 「はい、それもできましたよ」。
 先生には、いつも頭が上がらない。そこで、西出先生のつくってくれたファイルの中身をつぶさに検討しみて、ようやく得心がいった。なるほど。なるほど!
 ともあれ、簡体字と日本語漢字の相互変換ツールKanconvit をEmEditor のマクロに組みこむのは、誰にでもできる。その詳しい方法は、煩雑になるから本稿の最後に回そう。江村豊さんの回答を、素人の読者にわかるように、かみくだいて図解入りで、本稿後半で解説すると約束して、先を急ぐ。
 以下では、「Kanconvit 組み込んだEmEditor」(Kanco+Emと略称)が出来上がったものとして、その試運転を行ってみることにしよう。

(4) PinConv4とKanco+Emとの変換性能
 まず、簡体字で記した中共第18期中央委員(205名)の人名表を、Pinconv4 での2段階とKanco+Emとで日本漢字へ変換してみた。すると、205名中190名の変換が両者そろって正解を得た。それらは総て正解で、正解率93%という高率である。
両者で食い違いが生じたのは、図表4のように15名にすぎない。両者を引き比べてみると、Kanco+Emの方は、なんと正解率100%である!(日本漢字の正解は藤堂明保「学研漢和辞典ん」の見出し字を基準にした。)
Kanco+Emの性能は非常に優れているかもしれない。しかし、これは限られた人名という部分データにした偶然的結果かもしれず、別のデータによる点検が必要であろう。

図5 中共18期中央委員名(205名)の簡体字から日本漢字への変換結果
簡体字 Pinconv4 で2段階 Kanco+Em 正解
于广洲 於広洲 于広洲 于広洲
马飚 馬〓 馬飈
王侠(女) 王侠 王俠 王俠
王珉 王珉 王珉
王志 王誌剛 王志剛 王志剛
王洪 王洪尭 王洪 王洪堯
刘粤 劉〓軍
杜恒岩 杜恒巌 杜恒岩 杜恒岩
又侠 張又侠 張又俠 張又俠
长龙 範長龍 範長竜 範長竜
克志 趙克誌 趙克志 趙克志
夏宝 夏宝龍 夏宝竜 夏宝竜
蒋定之 蒋定之 蔣定之 蔣定之
蒋建国 蒋建国 蔣建国 蔣建国
蒋潔敏 蔣潔敏 蔣潔敏

 そこで、Pinconv+で変換ミスないし間に合わせの変換が起こる事例で、点検し直してみたものが図表5である。○は正解、×は不正解、△は複数正解があるが片方のみ表わしている。Pinconv+では失敗していたものが、Pinconv4 (2段階)では、ほとんどが正解を得ている。

袆→袆 冰→冰

の2字だけが変換されず簡体字のままであるが、Kanco+Emの変換よりも優れた結果を示している。
 Kanco+Emでは、

你→妳 袆→袆 钛→钛 镁→镁 辊→辊 赣→赣 兖→兖

の7字が×である。このうち你→妳の変換は何とも異常である。これは相互変換ツール Kanconvitのプログラムミスとしか考えられない。
 そのほかの6例は、簡体字→日本漢字が単純に1対1の対応をしている漢字であり、何故に変換できないのだろうか? Pinconv+における袆→袆  冰→冰も事情は同じである。
 いろいろ考えたが、これらの漢字については、おそらくKanconvitのプログラムで簡体字←→日本漢字の対応テーブルを作成していないのではないか? 対応テーブルがないものは、変換の対象にはならず、もとのまま放置されていると思われる。
 ここまで考えて、はたと思い当った。Kanconvitのプログラムで簡体字←→日本漢字の対応テーブルの点検をかけてみなくてはならない、と。

図5  Pinconv+とPinconv4(2段階)とKanco+Emの変換の正誤
簡体字 正解 Pinconv+ Pinconv4 で2段階 正誤 Kanco+Em 正誤
[イ尓] ×
× ×
[金太] ×
[金美] ×
[車昆] ×
[章[夂/貢]] ×
[亠/兌] ×
×
[シ耳]
[ロ卑]
[王奇]
[金/金金]
[金呂]
[糸刃]
[女尼]
[上/ト]
[丹彡]
[登β]
[土川]
[酉旨]
[門<虫]
[气<安]
广 广
弁あるいは辦
昇あるいは升
荘あるいは庄
製あるいは制
葉あるいは叶
沢あるいは澤
髪あるいは発
鉱あるいは礦
瀋あるいは沈
複あるいは復
雲あるいは云


(5) Kanconvit (JavaScript)の簡体字←→日本漢字の対応テーブルの修正
 簡体字と日本語漢字の相互変換ツール Kanconvitのjavascriptの中身を覗いてみよう。構造はごく簡単で、簡体字テーブルと日本漢字テーブルが対照的に並んでいて、変換対象の漢字収納個所の座標を合わせているだけのことである。

 簡体字はY軸14から51行まで、X軸は32列まで。総計1155字である。たったの1000字余であることが注目される。漢字の数は俗に5万字、日本の常用漢字は2136字、情報処理用のJIS第一水準漢字は2965字、第二水準漢字は3384字である。果たして、これだけで足りるのか、という疑問が湧くが、この問題は後回しにしよう。

 日本漢字のほうもY軸53行から89行まで、X軸は32列まで並んでいる。総計1155字である。個々の簡体字と対応する日本漢字とはピタリ同一座標で対照されている。変換は簡体字→日本漢字、日本漢字→簡体字の双方向で行われる。

 以上を前提にして、簡体字テーブルと日本漢字テーブルを対照して、点検していくことにしよう。
まずは、先に気付いた你が妳に変換されるという怪奇現象である。簡体字16行21列に你がある。日本漢字54行21列に妳がある。これは言い訳無用! 妳は你でなければならない。エディタの画面上で簡単に修正できるから直せばいい。
 そのほかに、単純ミスはないか? 目を皿にしてチェックしたが、幸い他に決定的なミスは発見できなかった。ただし、ミスではないが、21世紀中国総研が扱う中文では修正しておいたほうが「ベター」だというものがあった。数はわずか13であり、以下に一覧する。簡体字テーブルと日本漢字テーブルの当該位置も色を変えて明確にしておくことにしよう。これもテーブル上で簡単に修正することができる。

図7  Kanconvit (JavaScript)の漢字の対応テーブルの修正
kanconvit簡体字 kanconvit日本漢字 kanconvit日本漢字・訂正


 そこで、Kanconvitの漢字テーブルが総計1155字という数の少なさの問題に移ろう。そもそも1155字はどこから持ってきた字数なのであろうか? 
 日本の情報処理用の漢字は非論理的、非体系的で混乱しているが、JIS X 0208: 1997の文字表は6879字で、漢字だけでは6429字がリストアップされている。この数からなか1155字を差し引くと、5274字である。Kanconvitの漢字テーブルでは5000字以上がリストアップされていないことになるが、これはどう処理されているのであろうか。考えられるのは三つである。
 第一には、日本漢字(JIS X 0208: 1997)と 中国簡体字と字形が同一の漢字は、変換対象外であるから漢字テーブルを作らなくていい。
 第二には、中国簡体字にはあるが、日本では通用していない漢字については、簡体字←→簡体字のままでことが済み、漢字テーブルを作らなくていい。反対に、国字の類で日本漢字にはあるが、中国では通用していないものについても、同様に漢字テーブルを作る必要はない。
 以上の二つの漢字の数が、果たして5000字以上にもなるかどうか。文字表を比較対照すればカウントできないわけではないが、ここでそうした辛気臭い作業をしている余裕はない。仮に5000字以上にもならないとすると、第三に考えられるのは、使用頻度の少ない特殊な漢字については手抜きをするという実用的な方策である。きわめて使用頻度の低いものは、手作業で比較対照して修正すれば事足り、そのために汎用的な変換装置を作るまでもない。
 さきに、表5において点検サンプルとしての、袆钛镁辊赣兖、の6字が左右の簡体字テーブルのないことを確認した。これらは、手抜きの結果と推察される。袆钛镁辊赣兖は使用頻度は低く、手作業で変換したところで大した時間を食うわけではない、と言われればそれまでである。

図8 Kanconvit (JavaScript)の簡体字テーブル
簡体字
14 var zh =
15 '专业丛东丝丢严丧个丰临为丽举义乌乐乔习乡书买亏亚产亩亲' +
16 亿仅仆从仑仓仪们价仿众伞伟传伤伦伪佣侠侣侥侦侧侨俩俭债' +
17 '偿储兑兰兽冈军农冯冰冲决况冻净凄凉凌减凑凛几' +
18 '击凿划刘则刚创删别刽剂剑劝办务动劲劳势勋华协单卖卢卤' +
19 卷厂厉压厌厕厢县叁发变吊后吓吕吗吨听启吴呕' +
20 '员呛呜咸响哑哗哟唤啰啸喷嚣团园囱围图圆圈圣块坚坛坝坞坟坠' +
21 '垄垒垦垫墙增壤壳处备够头夹夺奋奖妆妇妈姊娄娱婴婶孙' +
22 '实宠审宪宫宽宾对寻导尔尘尝层屉屿岁岂岗岛峦崭巢巩币帅师帐' +
23 '帜带帮并广庄庆庐库应庙庞废开异弃弥弯弹强归录彻忆忧怀态总恳' +
24 '恶恼悬悯惊惠惧惩惫惭惯懒戏战户扎扑托执扩扫扬扰抚抠抡抢护报' +
25 '抬拂拔拜拟拢拣拥拦拧拨择挚挠挡挣挤挥捞损捡换捣据捻掷掸掺插揭' +
26 '搀搁搂搅摄摆摇摊撵攒收效敌敛斋斩时旷昙显晋晒晓晕暂术朴机' +
27 '杀杂权杨杰极构枣枪枫柠查栅标栈栋栏树桥桨桩检椭' +
28 毕毙毡气汹沉沟沥沦沧泪泻泼泽洒洼浆浇浊' +
29 测济浑浓涂涉涌涛涝涡涣涤润涧涨涩淀渊渐渔渗渴游溃溅滚满滤滥' +
30 澜濒灭灵灶灾烂烛烦烧烫热焕爱爷牵牺狈狞狮狰狱猎玛环' +
31 现琐琼电畅疗疟疮疯痪瘪瘫癣皱盏盐监盘睁瞒矫矾矿码砖砚砾' +
32 确碍碎秃秆秽稳稻穗穷窍窑窗窜窝窥竖竞笋笔' +
33 '签简箩篓篮篱类粮粹紧纠红纤约级纪纫纬纯纱纲纳纵纷纸纹纺纽' +
34 '线练组绅细织终绊绍绎经绑绒结绕绘给络绝绞统绢绣继绩绪续绰绳维绵绷' +
35 '绸综绽绿缀缅缆缎缓缔缕编缘缚缝缠缨缩缴罗罚罢翘耸聂聋职联聪' +
36 肃肠肾肿胀胁胶脉脏脐脑脓脸腻腾舆舰舱艰艺节芜苇苍苏' +
37 '茧荆荚荡荤荧药莲获莹萝萤营萧萨葱蒋蓝蔼蕴虏虑虽虾蚀蚁蚂' +
38 '蜕蜗蝉蝎衅衔补衬袄袭裤见观规觅视览觉誊计订认讥讨让训议讯' +
39 '记讲讳讶许讹论讼讽设访诀证评诅识诈诉诊词译试诗诚话诞诡询该详诫诬' +
40 '语误诱诲说诵请诸诺读诽课谁调谅谆谈谊谋谍谎谐谒谓谚谜谢谣谤谦谨谬' +
41 '谭谱谴贝贞负贡财责贤败账货质贩贪贫贬购贮贯贰贱贴贵贷贸费贺贼贾' +
42 '贿赁赂赃资赊赋赌赎赏赐赔赖赘赚赛赞赠赡赢赵趋跃踪躯车轧轨轩转轮' +
43 '软轰轴轻载轿较辅辆辈辉辐辑输辕辖辙辩辫边辽达迁过迈还这进远违连' +
44 '迹适选逊递逻遗邓邮邻郑酝酱酿醉采释鉴针钉钓钙钝钞钟钠钢钥钦钧' +
45 '钩钮钱钳钻钾铁铃铅铆铜铝铡铣铭铲银铸铺链销锁锄锅锈锋锌锐错锚锡锣' +
46 '锤锥锦锨锭键锯锰锹锻镀镇镊镐镜镣镰镶长门闪闭问闯闰闲间闷闸闹闺闻' +
47 '闽阀阁阅阎阐阔队阳阴阵阶际陆陈陕陨险难雏霉霸韧韩页顶' +
48 '顷项顺须顽顾顿颁颂预颅领颇颈颊频颓颖颗题颜额颠颤风飘飞饥饭饮饰饱' +
49 '饲饵饶饺饼饿馁馅馆馋馏馒马驮驯驰驱驳驴驶驹驻驼驾骂骄骆骇验骏骑骗' +
50 '骚骡骤鱼鲁鲜鲤鲸鳖鳞鸟鸡鸣鸥鸦鸭鸯鸳鸵鸽鸿鹃鹅鹊鹏鹤鹰黑默齐齿' +
51 '龄龙龟';


図9 Kanconvit (JavaScript)の日本漢字テーブル
日本漢字
52 var ja =
53 '醜専業叢東絲丟両厳喪個豊臨為麗挙麽義烏楽喬乗習郷書買虧雲亜産畝親' +
54 億僅僕従侖倉儀們価倣衆優夥傘偉伝傷倫偽仏傭俠侶僥偵側僑倆倹債値' +
55 '傾仮償儲児兌蘭関興養獣岡冊軍農馮氷沖決況凍浄淒涼淩減湊凜幾鳳憑凱' +
56 '撃鑿劃劉則剛創刪別劊剤剣剝劇剰勧辦務働勁労勢勲勻華協単売蔔盧鹵臥' +
57 衛巻廠庁厲圧厭廁廂廈県三発変畳葉嘆籲弔後嚇呂嗎噸聴啓呉嘔' +
58 '員嗆嗚詠嚨鹹響啞嘩喲喚嘯噴囂団園囲図円圏聖場壊塊堅壇壩塢墳墜' +
59 '壟塁墾墊牆増壌殻壺壱処備復頭誇夾奪奮奨粧婦媽姉婁嬌嬢娯嬰嬸孫寧' +
60 '実寵審憲宮寛賓対尋導爾塵嘗屍層屜屢嶼歳豈崗島嶺巒嶄巣鞏幣帥師帳簾' +
61 '幟帯幫併広荘慶廬庫応廟龐廃開異棄張彌彎弾強帰録徹徳憶憂懐態憐総懇' +
62 '悪悩懸憫驚恵懼懲憊慚慣癒憤願懶戯戦戸紮撲託執拡掃揚擾撫摳掄搶護報' +
63 '擡払抜拝擬攏揀擁攔擰撥択掛摯撓擋掙擠揮撈損撿換搗拠撚擲撣摻挿掲攬' +
64 '攙擱摟攪捜摂擺揺攤撐攢収効敵斂斎斬無時曠曇顕晉曬暁暈晩暫術樸機' +
65 '殺雑権楊傑極構棗槍楓櫃檸査柵標桟棟欄樹棲様檔橋槳樁夢検橢搾桜' +
66 歩殲毀毎畢斃氈気漢汚湯洶沈溝瀝淪滄滬濘涙潟潑沢潔灑窪漿澆濁' +
67 測済渾濃塗渉湧濤澇渦渙滌潤澗漲渋澱淵漸漁滲渇遊潰濺渓滾満濾濫' +
68 瀾瀕滅霊竈災燦砲爍爛燭煙煩焼燙熱煥愛爺牽犠猶狽獰獅猙獄猟豬瑪環' +
69 現瑣瓊甕電暢疇療瘧瘡瘋癢瘓癟癱癬皺盞塩監蓋盤睜瞞矯礬鉱碼磚硯礫' +
70 碩確礙砕禱禍離禿稈種積稭穢穏稲穂窮竅窯窓竄窩窺豎競筍筆籠築' +
71 '篩籌簽簡籮簍籃籬類糞糧粋緊糾紅繊約級紀紉緯純紗綱納縦紛紙紋紡紐' +
72 '線練組紳細織終絆紹繹経綁絨結繞絵給絡絶絞統絹繡継績緒続綽縄維綿繃' +
73 '綢綜綻緑綴緬纜緞緩締縷編縁縛縫纏纓縮繳網羅罰罷羨翹聳恥聶聾職聯聰' +
74 粛腸膚腎腫脹脅勝膠脈臓臍脳膿臉臘膩騰輿舎艦艙艱芸節蕪葦蒼蘇蘋' +
75 '範繭荊薦莢蕩栄葷熒薬萊蓮獲瑩蘿蛍営蕭薩蔥蔣藍藹蘊蔵虜慮雖蝦蝕蟻螞' +
76 '蛻蝸蠟蠅蟬蠍釁銜補襯襖襪襲褲裏見観規覓視覧覚謄計訂認譏討譲訓議訊' +
77 '記講諱訝許訛論訟諷設訪訣証評詛識詐訴診詞訳試詩誠話誕詭詢該詳誡誣' +
78 '語誤誘誨説誦請諸諾読誹課誰調諒諄談誼謀諜謊諧謁謂諺謎謝謡謗謙謹謬' +
79 '譚譜譴穀貝貞負貢財責賢敗賬貨質販貪貧貶購貯貫弐賤貼貴貸貿費賀賊賈' +
80 '賄賃賂贓資賦賭贖賞賜賠頼贅賺賽賛贈贍贏趙趕趨躍蹤軀車軋軌軒転輪' +
81 '軟轟軸軽載轎較輔輛輩輝輻輯輸轅轄轍弁弁辺遼達遷過邁運還這進遠違連' +
82 '遅跡適選遜逓邏遺遙鄧郵隣鄭醞醬醸酔採釈鑑針釘釣鈣鈍鈔鐘鈉鋼鑰欽鈞' +
83 '鈎鈕銭鉗鑽鉀鉄鈴鉛鉚銅鋁鍘銑銘鏟銀鋳舗鏈銷鎖鋤鍋鏽鋒鋅鋭錯錨錫鑼' +
84 '錘錐錦錠鍵鋸錳鍬鍛鍍鎮鑷鎬鏡鐐鐮鑲長門閃閉問闖閏閑間悶閘鬧閨聞' +
85 '閩閥閣閲閻闡闊隊陽陰陣階際陸陳陝隕険陥隠隷難雛彫霧黴覇韌韓韻頁頂' +
86 '頃項順須頑顧頓頒頌預顱領頗頸頰頻穎顆題顔額顛顫風飄飛飢飯飲飾飽' +
87 '飼餌饒餃餅餓餒餡館饞餾饅馬駄馴馳駆駁驢駛駒駐駝駕罵驕駱駭験駿騎騙' +
88 '騒騾驟髄魚魯鮮鯉鯨鼈鱗鳥鶏鳴鷗鴉鴨鴦鴛鴕鴿鴻鵑鵝鵲鵬鶴鷹黒黙斉歯' +
89 '齢竜龜';

 しかし、なお、隴を得て蜀を望むことに、こだわろうではないか。
 袆钛镁辊赣兖のような、手作業変換を強いられた漢字は記録しておいて、ある程度まとまったところで、Kanconvit (JavaScript)の簡体字テーブルと日本漢字テーブルの最後に追加貼り付けすれば、自動変換が可能になろう。具体的には、以下のごとくにすればいい。
 まず簡体字テーブルの最終である第51行第3列以下の 龟'; に着目したい。この 龟と ';の間に、袆钛镁辊赣兖を挿入する。
 次に、日本漢字テーブルの最終である第89行第3列以下の 龜'; に目をつけ、この 龜と ';の間に、褘鈦鎂輥贛兗を挿入する。注意すべき両方のテーブルの漢字の順番が完全に対照していることだけである。
 これで修正Kanconvitの漢字テーブルが出来上がりである。
 Kanco+Emの優れたところは、利用者の目的と環境に即した自分の簡体字←→日本漢字変換ツールを、簡単に最適化できることである。継続した意志さえあれば、次第に変換結果の修正手作業が非常に少ない、性能がより優れた自動変換装置に変えることができる。

図10 Kancovit漢字テ-ブルの追加修正例

(6)Kanconvit をテキストエディタEmEditor のマクロに組み込む方法
 以下、先に約束したKanconvit をテキストエディタEmEditor のマクロに組み込む方法を、ガイドしておこう。

 図3のEmEditorの開発者・江村豊さんの回答は、3段階からなる。これを素人にもわかるように易しく解説し直すことにする。

① 第1段階。
 kanconvit.jsの中身を、最初の /* から最後の })(); までをコピーしてEmEditorの新規画面に貼り付ける。重要なのはそのあとで、保存の形式を正確に指定することである。
 ファイル名は「kanconvit.js」。ファイルの種類は 「JavaScript(*.js)。エンコードは「UTF-16(BOM付き)」。これをMy Document の中に作った My Macros フォルダ内に収納する。
② 第2段階。
 ① とは別にMy Macros のフォルダ内に、もう2つEmEditorのファイルを作成して収納する。
一つ目はja2zhファイル。すなわちjapan to zhongguo(日本漢字から中国漢字に変換)のための命令(マクロ)となるものである。EmEditor の新規画面のトップに以下の命令を、コピー・ペーストする。

 #include "kanconvit.js"
document.selection.Text = Kanconvit.ja2zh( document.selection.Text );

 ただこれだけである。ファイル名は「ja2zh.jsee 」とする。ここでも保存の形式をきちんとしなければならない。つまり、ファイルの種類は 「JavaScript(*.jsee)。エンコードは「UTF-16(BOM付き)」。
二つ目はzh2jaファイル。すなわちzhongguo to japan(中国漢字から日本漢字に変換)のための命令(マクロ)となるものである。ファイル名は「zh2ja.jsee 」とする。ファイルの種類は 「JavaScript (*.jsee)。エンコードは「UTF-16(BOM付き)」。
以上三つのファイルをMy Macros のフォルダ内に収納すれば準備完了である。あとは、この3つのマクロファイルを実行するだけである。
③ 第3段階(簡体字→日本漢字の変換を事例に)
 まず、EmEditorを新規に開く。(簡体字を日本漢字に変換したいテキストを開いてもよい。)

図11 EmEditor のマクロ

 最上部の「マクロ(M)」をクリックすると、プルダウンメニューが現れる(図9)。その中から「選択」を選ぶ。すると、コンピュータ内に収録されているフォルダーが階層をもって現れるから、その中から先のMy Macrosファルダーを選び、そこに収録されている、zh2ja.jseeファイルをクリックする。すると図9のように「実行」のところに、zh2ja.jsee が立ち現われる。
 そこで、画面に簡体字を日本漢字に変換したいテキストを貼り付ける。次いで、そのテキストの変換したい部分を、ドラッグ(マウス左ボタンを押しながらなぞる)して選択する。
 最後に、「実行」をクリックする。画面には、実行結果の日本漢字が現れるであろう。

図10  Kanco+Emによる簡体字から日本漢字への変換結果

 日本漢字→簡体字変換は、同様にja2zh.jseeを選んで実行すれば良い。

このページの上へ <目次>へ戻る