Kawa.netブログ(川崎有亮)

アクセスカウンタ

help リーダーに追加 RSS [Perl] 日本語・中国語・韓国語/ローマ字変換モジュール

<<   作成日時 : 2006/03/27 01:20   >>

トラックバック 0 / コメント 0

ローマ字への変換(読み下し)を行う Perl モジュールを作成してみました。
Lingua::JA::Romanize::Japanese  →日本語用(漢字かな混じり文)
Lingua::ZH::Romanize::Pinyin   →中国語用(北京語読み)
Lingua::ZH::Romanize::Cantonese →広東語用(香港など)
Lingua::KO::Romanize::Hangul   →韓国語用(ハングル文字)

ダウンロードや、お試しデモは↓こちらから。
http://www.kawa.net/works/perl/romanize/romanize.html#demo

日本語版は、SKKの辞書を使用しています。(感謝!)
基本的に辞書登録キーワードの最長マッチングで、送り仮名も確認しています。
とはいえ、ChaSen のような形態素解析は行わないし、音読み・訓読み等の完全な判断は無理ッス。
辞書としては、KAKASI と同等なのかな、たぶん。

中国語版/広東語版は、cxterm に付属の辞書を使用しています。(謝々!)
中国語版/広東語版は、↓の2003年頃に作成していたページが元になっています。
http://www.kawa.net/works/cantonese/canton.cgi
http://www.kawa.net/works/cantonese/ccdict.cgi
中国語には方言が多いですし、読み方(ピンインの表し方)も何通りもあるようなので、
他のバリエーションも使えるようになると面白いですね。

韓国語版は、辞書はありません。↓の1998年頃に作成していたページは反対方向で、
ローマ字→ハングル変換を行っていました。
http://www.kawa.net/works/hangul/hangul.cgi
しかし、内容が正しいのかはあまり自信なく。(汗)

設定テーマ

関連テーマ 一覧

月別リンク

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文

EDGE Now!