« 年の初めに/日本の針路(361) | トップページ | 対立軸としての原発/技術論と文明論(87) »

2018年1月 2日 (火)

AIによる古文書の判読/知的生産の方法(167)

地域の歴史等を調べようとすると、古文書の読解が必須である。
以下のような文書である。
Photo_3
白石村古文書

古文書などの史料を読解するためには「判読」と「解読」という2つのプロセスを経ることが必要である。
Photo_3

しかし、活字を印刷した文書に慣れている人間にとって、判読がなかなか難しい。
字の単位(1字なのか、2字なのか・・・)すら分からないし、仮名か漢字かも分からない。
仮名が漢字から作られていることからすれば当然のことではあるが。
⇒2008年2月17日 (日) 判読と解読
⇒2008年2月18日 (月) 右と左の識別

文字の崩し方には一定のパターンがある。
1990年代の終わりごろ、大学の理工学部でパターン認識を結球している知人に、何とか読解支援ができないだろうか、と相談を持ち掛けたことがある。
趣味でやっていた利根川開発史のサークルで、古文書を読んでいたからである。
知人は「できると思うよ」と軽く返事をしたが、仕事とは無関係だったので、話は発展しなかった。

ここ数年、機械学習(ディープラーニング)が話題になっている。
専用AIでは、人間を凌駕する「読み」を示すことは、将棋や囲碁で話題になっている。
これなら、古文書読解にも可能性が広がるのではないかと思っていた。
東京農工大の中川研究室の院生たちが、古文書読解アルゴリズムで、表彰を受けたというニュースがあった。

東京農工大学は、同大学の学生が考案したアルゴリズムが「第21回アルゴリズムコンテスト」において、最優秀賞を受賞したと発表した。古典籍画像の指定領域に含まれるくずし字をAIに認識させる課題で、優秀な認識性能を示したということだ。
Photo_2
同アルゴリズムは、東京農工大学大学院工学研究院の中川研究室の修士課程2年リー・トゥアン・ナムと博士課程1年グエン・コング・カーが考案したもので、11月に開催された4th International Workshop on Historical Document Imaging and Processing(HIP 2017)でも、最優秀論文賞を受賞している。
同アルゴリズムコンテストは、パターン認識・メディア理解分野の若手研究者・学生の育成および研究会活動の活性化を目的として、毎年開催されているもの。提示される課題には、代表的・基礎的な研究課題が取り上げられ、応募されたアルゴリズムは、その性能・独創性・処理時間の観点で評価される。今年は、古典籍画像の指定領域に含まれるくずし字を認識して、コードを出力する課題が出された。課題は、外接する長方形に含まれる文字数に応じて難易度が設定されており、レベル1は1文字、レベル2は縦方向の3文字、レベル3は縦横方向の3文字以上の文字が含まれている。なお、認識対象の文字は変体かな50種程度で、漢字は含まれていない。
東京農工大、古典籍のくずし字をAIが認識するコンテストで最優秀賞

私(たち)は、AIの行方をどこまで見定められるのだろうか?

|

« 年の初めに/日本の針路(361) | トップページ | 対立軸としての原発/技術論と文明論(87) »

思考技術」カテゴリの記事

書籍・雑誌」カテゴリの記事

知的生産の方法」カテゴリの記事

コメント

Sexy photo blog
http://sexypic.erolove.in/?entry.mina
sex with a hemorphidite wwwx hamster asian com hot girls naked pornstars thai food in astoria ny how to enter first time penis in girls sex vedio

投稿: essiejh60 | 2018年1月 3日 (水) 10時22分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/395349/72482747

この記事へのトラックバック一覧です: AIによる古文書の判読/知的生産の方法(167):

« 年の初めに/日本の針路(361) | トップページ | 対立軸としての原発/技術論と文明論(87) »