【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12]at SCIENCEPLUS
【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12] - 暇つぶし2ch2:ニュースソース検討中@自治議論スレ
19/07/12 04:39:28.03 taourUqC.net
読めないようにしてきたんじゃないかね

3:ニュースソース検討中@自治議論スレ
19/07/12 04:54:14.32 jFOmPVIq.net
タリン・カラーヌワット女史
タイ生まれ、若い時によんだあさきゆめみしを見て源氏物語にぞっこん
日本語学科を通して日本に留学、くずし字を勉強するも挫折するが
自分で書いてみれば習得できるのではと思いつき、実際に書くことで
くずし字を習得する

4:ニュースソース検討中@自治議論スレ
19/07/12 05:22:04.40 /3s2Oryf.net
くずし字の変体仮名は似た字が多いけどちゃんと区別できてるならすごいな

5:ニュースソース検討中@自治議論スレ
19/07/12 05:53:45.63 9lfd8ap3.net
>>3
ネトウヨホルホル?

6:ニュースソース検討中@自治議論スレ
19/07/12 06:03:39.12 PbHZXaOR.net
何処で翻訳してくれるんだよ

7:ニュースソース検討中@自治議論スレ
19/07/12 06:04:08.75 l3OtA+BB.net
>>5
パヨクって日本語しか話せないから日本から出て行けと言われたら自殺するしかないんだね

8:ニュースソース検討中@自治議論スレ
19/07/12 06:07:59.28 rM6SITwv.net
まあ 読めるようになるのはいいけど 一般人が閲覧できるように
しっかりなるかが課題だな 日本はそこが弱いし 隠す傾向が強いwwww
しっかりオープンソースでそうして欲しいねw
わたしからは以上だな ミカエル(悟ったもの)より。

9:ニュースソース検討中@自治議論スレ
19/07/12 06:09:52.58 MDxFwwFe.net
直接英訳した方が早そうだな

10:ニュースソース検討中@自治議論スレ
19/07/12 06:24:09.13 z7V4WmKC.net
>>2
権威主義の専門家が自己の読み間違えを理屈こねて正当化定着とかさせちゃったりしてきたからね。

11:ニュースソース検討中@自治議論スレ
19/07/12 06:24:22.78 topiQE+E.net
>>3
ひたすら感謝だわ。ほんとありがとう。
崩し字読めないアマチュア勢も古文書から情報読み取れるようになるから、
色々面白い研究成果が生まれそう。

12:ニュースソース検討中@自治議論スレ
19/07/12 06:30:44.39 ng+bSJdz.net
俺んちもそんな巻物があるんだけど解読できなくてなあ
とにかく在野の歴史マニア歓喜だろ

13:ニュースソース検討中@自治議論スレ
19/07/12 06:34:20.92 mNaeYk7+.net
くずし字って英語の筆記体みたいなもんだろ

14:ニュースソース検討中@自治議論スレ
19/07/12 06:43:20.97 oFUsX1nA.net
>>3
タイ人→源氏物語→くずし字
こりゃ大変だったろうな
ありがとう

15:ニュースソース検討中@自治議論スレ
19/07/12 06:49:38.41 wKkPQ5Nx.net
>>1
一般公開されれば、いずれ神田の古書街が大にぎわいになるな

16:ニュースソース検討中@自治議論スレ
19/07/12 06:56:58.44 YVRCJJml.net
一回だけ、この研究員の得意技である松葉くずしをやってみたい。

17:ニュースソース検討中@自治議論スレ
19/07/12 07:09:08.42 fhu+pVUO.net
棋士vs将棋ソフトみたいに磯田vs翻訳ソフトを

18:ニュースソース検討中@自治議論スレ
19/07/12 07:10:16.70 JLPhqpLB.net
>>16
松葉くずしとか紅葉合わせとか、むかしのひとは性技を木の葉で例えるように
しとったんだねww

19:ニュースソース検討中@自治議論スレ
19/07/12 07:12:19.74 HauSnpME.net
英語も筆記体見なくなったよな

20:ニュースソース検討中@自治議論スレ
19/07/12 07:15:58.63 MshbsGTn.net
>>3
素晴らしい。

21:ニュースソース検討中@自治議論スレ
19/07/12 07:18:38.04 WfSjGxJF.net
変態少女

22:ニュースソース検討中@自治議論スレ
19/07/12 07:21:52.89 Ru4lYaKe.net
狂喜乱舞って久々に聞いた

23:ニュースソース検討中@自治議論スレ
19/07/12 07:41:11.77 CXUjQHor.net
すごいなAI。翻訳ツールが何を開発したのか気になる

24:ニュースソース検討中@自治議論スレ
19/07/12 07:54:50.06 rzv8Dyz5.net
昔の人はよく読めてたなってほんと思う

25:ニュースソース検討中@自治議論スレ
19/07/12 08:06:50.69 WNz8Ffr9.net
すごいけど日本語で外国人に先越されるなんて日本人なにやってんだよほんと

26:ニュースソース検討中@自治議論スレ
19/07/12 08:13:30.83 6RY+2KLd.net
これは素晴らしい
文化勲章を差し上げたい

27:ニュースソース検討中@自治議論スレ
19/07/12 08:16:17.25 Rp1g37ao.net
これは素晴らしい、でもこれは文字を解析しただけで翻訳と言えるのだろうか
次は本当の意味での翻訳だな

28:ニュースソース検討中@自治議論スレ
19/07/12 08:19:29.23 Ju87KtXY.net
地味だけどこれは素晴らしい技術ですね
過去の資産を十分に生かせるようになる
焚書したり文字を捨てたりする国は滅ぶ

29:ニュースソース検討中@自治議論スレ
19/07/12 08:27:31.41 eJo2rLSF.net
>>3
「あさきゆめみし」って少女漫画ですよね
それを読んで日本漫画オタになったタイ少女の成功物語
ぜひとも映画化してほしい

30:ニュースソース検討中@自治議論スレ
19/07/12 08:44:25.36 5773tsx3.net
古文書片っ端から解読して青空文庫に上げてほしい。
で口語訳もAIでやってできるようにして。
で、それらの成果物の著作権とかはどうなるんかな。

31:ニュースソース検討中@自治議論スレ
19/07/12 08:44:48.70 2/uPUTnv.net
>>3
タイ人なのにってより、文系なのにってところで感心するわ。
「好き」って大事だな。
俺も宇宙の研究やりたかった。

32:ニュースソース検討中@自治議論スレ
19/07/12 09:37:24.43 csupAlXt.net
日本人研究者は日本語をAIで解読することを邪道と思ってたとか?
あるいは文系研究者はAIで何ができるかわかっていなかったとか
ありがちな話だけどどーなの

33:ニュースソース検討中@自治議論スレ
19/07/12 09:43:28.69 CHBCtbh1.net
ネットの認証セキュリティで日本語のくずし字を記入するサイトがあるけれども
あれもやっぱり近い将来にAIに判読されそうだな

34:ニュースソース検討中@自治議論スレ
19/07/12 09:43:29.26 KAjIdVl5.net
明治大正時代の外交文書なんか見てても
官僚が墨で自筆で書いたものは判読が結構厳しい
活字印刷は隔世の感があるね

35:ニュースソース検討中@自治議論スレ
19/07/12 09:44:02.95 xcnBq66z.net
>>32
どっちかいうと後者じゃないかなぁ

36:ニュースソース検討中@自治議論スレ
19/07/12 09:55:40.86 O06XyrAk.net
欲しい!
今欲しい!

37:ニュースソース検討中@自治議論スレ
19/07/12 09:57:04.64 +fas7KGb.net
これが正しいAIの使い方だな。
ただ、10年位英翻訳があのままなの見ると絶望だが

38:ニュースソース検討中@自治議論スレ
19/07/12 10:00:36.69 lNne9+0c.net
現代日本人が読めなくなったくずし字をタイ人が解決するって面白いなぁ
読めないから書くところから始めるとか
めっちゃ地味だけどほんとに好きなんだろうな
感謝

39:ニュースソース検討中@自治議論スレ
19/07/12 10:07:34.49 Nwhtdr6Y.net
>>2
幕末のちゃんとした人が書いてるのはほぼ現代語で
一部のくずし字がわかれば普通に読めるぞ
特に薩長の文書は読みやすい
ここの役人が明治政府を作って現代語をつくったのがよくわかるわ

40:ニュースソース検討中@自治議論スレ
19/07/12 10:09:30.10 wBoGyUge.net
>>25
おまえは部屋から出ろ。

41:ニュースソース検討中@自治議論スレ
19/07/12 10:16:28.94 CfJTQR9r.net
韓国は漢字を廃止したから過去の文献を読めないなんてのはウソだから
韓国人だって専門家は読める
また日本人だって専門家しか過去の文献は読めない

42:ニュースソース検討中@自治議論スレ
19/07/12 10:34:08.94 ZHjaGhcZ.net
磯田道史がダメ出しの嵐

43:ニュースソース検討中@自治議論スレ
19/07/12 10:34:16.89 YVOEsxgx.net
AIといっても、
大量の古文書の画像データを集めて、マッチングしたものを現代語に変換する、
そんな総当たり的なやり方なんでしょ?

44:うひょのふ
19/07/12 10:39:58.86 2/+l8nzr.net
ぶっちゃけ、本能寺で信ちゃんやったの、俺なんだよねwww
竜馬、すまん。暗殺の首謀者な、実は俺、的な大発見来るか??

45:ニュースソース検討中@自治議論スレ
19/07/12 10:41:50.63 xQEYT0PT.net
そういえば、英語の筆記体も、知ってるのは日本人くらいらしいな。
ネイティブは筆記体でなんか書かないし、読めない。

46:ニュースソース検討中@自治議論スレ
19/07/12 10:44:06.91 sAr4mNCl.net
>>40
部屋から出るとか出ないとかじゃなく、>>25の感想は普通だと思うよ。
開発者の名前を見て一瞬目が点になったもの。

47:ニュースソース検討中@自治議論スレ
19/07/12 10:44:25.47 mFHlnqv9.net
解読する必要性を教えてくれ

48:ニュースソース検討中@自治議論スレ
19/07/12 10:47:35.70 E1xARvS9.net
これで戦国の世にタイムスリップしても一安心だ

49:ニュースソース検討中@自治議論スレ
19/07/12 10:47:59.15 sAr4mNCl.net
>>45
看護学校に行った娘が筆記体を習わせられて文句言ってたけど
カルテに筆記体で書く年寄り先生もいるからじゃないの?って言ったら納得してた。

50:ニュースソース検討中@自治議論スレ
19/07/12 10:50:56.18 aTIm5XFr.net
アホには翻訳後の翻訳が必要なんだが

51:ニュースソース検討中@自治議論スレ
19/07/12 10:55:47.14 lNne9+0c.net
「翻刻」っていう作業らしい
>>49
筆記体じゃなくそれぞれのミミズ字を習得する必要が・・

52:ニュースソース検討中@自治議論スレ
19/07/12 11:15:08.12 nE6EdNwz.net
>>43
だから?

53:ニュースソース検討中@自治議論スレ
19/07/12 11:23:03.06 c+QE6OO7.net
くずし字読む入門書買ったことあるけどすぐ挫折した
崩し方の幅がありすぎ

54:ニュースソース検討中@自治議論スレ
19/07/12 12:03:11.05 Ui262f28.net
日本ファンのタイ人研究者さん、ありがとう。

55:ニュースソース検討中@自治議論スレ
19/07/12 12:07:01.44 t8wp7mb7.net
マイルドな暗号通信に使えるかな

56:ニュースソース検討中@自治議論スレ
19/07/12 12:08:08.26 2ZBwq/7d.net
>>32
日本語は 漢字 ひらがな カタカナ English 0123...9 などから成る
英語は 0123...9 abc...z ABC...Z と少ない
そして現在の書かれた文字の認識は統計アルゴリズム、つまり数学によって実装されている
数学的には、分類する種類の数が大きいほど指数関数的にサンプルデータ必要です
つまり数が必要だったから現実的じゃなかった

57:ニュースソース検討中@自治議論スレ
19/07/12 12:08:09.86 WaLRWOIQ.net
文字を判読できるのと意味がわかるのはまた別だからな
今では使わない単語や別の意味で使っている単語があるから
現代語に翻訳する機能も必要

58:ニュースソース検討中@自治議論スレ
19/07/12 12:08:21.32 ogtEBmZY.net
>>46
日本人向けなら読解書とか対応表とかあるだろうし、
古文の文法も中高でやらされるし、ある程度読むなら困らないんだろうな

59:ニュースソース検討中@自治議論スレ
19/07/12 12:08:37.06 gk7VSkL0.net
ど素人の大量参入により
日本史学会壊滅w

60:ニュースソース検討中@自治議論スレ
19/07/12 12:10:50.25 2ZBwq/7d.net
>>45
イギリスに home stay したが、その人は筆記体で手紙くれたよ
イギリスのヨークの人

61:ニュースソース検討中@自治議論スレ
19/07/12 12:32:14.47 MxwoV/4r.net
>>31
なにその文系なのにって
彼女に謝れ

62:ニュースソース検討中@自治議論スレ
19/07/12 12:33:52.68 48MDVFk6.net
アラビア語翻訳システム作ってくれよ

63:ニュースソース検討中@自治議論スレ
19/07/12 12:36:55.38 Rs+2x9VG.net
狂喜乱舞ってバカじゃねえか
日本の学界はなーーーんにもやってこなかったんだろ
なんでガイジンに先越されてんだ
ほんとうにバカの集まりだから学会なんて解体しろよ

64:ニュースソース検討中@自治議論スレ
19/07/12 12:46:59.86 eJo2rLSF.net
>>31
初めて買ってもらったPCのおまけで
プログラミングの入門書がついてて、その方面も強くなったらしい
これって文系理系で分ける発想がそもそもなかったからこその成果だよね

65:ニュースソース検討中@自治議論スレ
19/07/12 12:47:20.68 cfNjtDjw.net
グーグルドキュメントのOCR精度はここ数年で眼を見張るほど上がって行ってるからな
どんどん便利になるなあ

66:ニュースソース検討中@自治議論スレ
19/07/12 12:47:45.52 f8gtXaBL.net
>>7 J( 'ー`)し「出ていけ。」

67:ニュースソース検討中@自治議論スレ
19/07/12 12:56:36.65 G5UX1/nz.net
古文書って古民家に結構眠ってるけど状態悪いと引き取り手は無いし
修復するのに金も掛かるんで結局ゴミとして捨てられることが多い

68:ニュースソース検討中@自治議論スレ
19/07/12 12:59:11.59 3r99fJWG.net
しかし、考えてみると人間の分析能力ってすごいよな。
個人ごとに癖があって異なっている崩し字を昔の日本人は何の苦労もすることなく
スラスラ読めていたんだから。

69:ニュースソース検討中@自治議論スレ
19/07/12 12:59:39.59 bMQfYDvj.net
これで古文書の研究者が失業するのか?
だとしたら大きな改善になるな

70:ニュースソース検討中@自治議論スレ
19/07/12 13:00:42.61 786TTjbe.net
昔は読み書きできた人はごく一部の気がする

71:ニュースソース検討中@自治議論スレ
19/07/12 13:04:26.41 DgiyrrGG.net
>百数十年前までは皆が読めていた「くずし字」。
識字率凄いな
>今は人口の0.01%以下しか読めないという現実
人数として十分じゃね?

72:ニュースソース検討中@自治議論スレ
19/07/12 13:07:29.64 Yjo+99xF.net
URLリンク(pc.watch.impress.co.jp)
だいぶ顔がくずれとるな。

73:ニュースソース検討中@自治議論スレ
19/07/12 13:12:00.23 h/0+bYnS.net
>>31
> 文系なのに
頭固いなあ

74:ニュースソース検討中@自治議論スレ
19/07/12 13:12:30.82 lNne9+0c.net
破顔

75:ニュースソース検討中@自治議論スレ
19/07/12 13:13:04.73 h/0+bYnS.net
>>70
江戸時代は89%超えだよ

76:ニュースソース検討中@自治議論スレ
19/07/12 13:13:58.55 h/0+bYnS.net
>>70
誤タイプ
80%超えだよ

77:ニュースソース検討中@自治議論スレ
19/07/12 13:24:58.04 3r99fJWG.net
 >>70
それは朝鮮半島の話。
 日本ではすでに江戸時代に多くの人が読み書きできるようになっていた。

78:ニュースソース検討中@自治議論スレ
19/07/12 13:26:19.35 lpWL5JY0.net
春画で試してみたい

79:ニュースソース検討中@自治議論スレ
19/07/12 13:47:17.67 K/MQT4bj.net
マジすげぇ
読める人かなり希少だから今読める人の仕事奪わないし、解読する時間を研究に回せるし、マジすげぇ

80:ニュースソース検討中@自治議論スレ
19/07/12 13:58:06.75 YVRCJJml.net
>>18
「紅葉合わせ」って「貝合わせ」のこと??

81:ニュースソース検討中@自治議論スレ
19/07/12 14:14:00.47 xIY+ej2k.net
素人目に圧倒的に凄い。だって読めないもん。
むしろ素人向きな気がする。
プロにとっては稀にある読み取りミスが鬱陶しいだろなぁ。
ちょっとでも誤りがあると全部チェックするしかないしかなりしんどい。
変に文脈・単語から修正とかすると意味が正反対になったりしそう。

82:ニュースソース検討中@自治議論スレ
19/07/12 14:21:54.54 N3EVhujM.net
>>32
日本人研究者は読めちゃうからイラン。苦手でも周りに読める人がいっぱいいる
困ってるのは一般人と外人で、だから外人が作ったってとこやろ

83:ニュースソース検討中@自治議論スレ
19/07/12 14:26:54.15 vILUWq4Y.net
すげえな
ありがたい

84:ニュースソース検討中@自治議論スレ
19/07/12 14:33:05.27 ZISKyxTg.net
>>82
そこが研究の敷居の高さになってるから、どれだけオープンにするかだね
日本語の文献史学はどんどんノンネイティブの人が参入して欲しい
万葉集とか古いのはネタが尽きて、研究進まんのよ

85:ニュースソース検討中@自治議論スレ
19/07/12 14:52:33.47 PxI9HLT3.net
唯一座学分野でこれだけは母親に負けてるわ。
あの糞ババア草書書けるからな。

86:ニュースソース検討中@自治議論スレ
19/07/12 14:54:04.86 PxI9HLT3.net
女手のひらがな自体草書で崩した書体の表音文字化に過ぎんからな。

87:ニュースソース検討中@自治議論スレ
19/07/12 15:16:06.85 eTTJMA0H.net
崩し字と只単に字が汚い場合の区別もつきそうだなw

88:ニュースソース検討中@自治議論スレ
19/07/12 15:19:57.30 XFqD/GLA.net
古文書解読習得アプリって、これまでも出ていたよね。

89:ニュースソース検討中@自治議論スレ
19/07/12 15:26:53.59 pIjmw3tX.net
タリン・カラーヌワット女史じゃねえよ!

90:ニュースソース検討中@自治議論スレ
19/07/12 15:35:04.45 PnTVp8Hd.net
手書きハングルも読みにくい。

91:ニュースソース検討中@自治議論スレ
19/07/12 15:52:49.75 Y+hrN0yF.net
>>1
URLリンク(pc.watch.impress.co.jp)
まちがっとるやんけ
×おとなにことを
○おとなふことを

92:ニュースソース検討中@自治議論スレ
19/07/12 16:13:25.10 Ek0qpc3R.net
磯田先生も愛用

93:ニュースソース検討中@自治議論スレ
19/07/12 16:36:42.48 ch4vsYUH.net
なんでも鑑定団ご推薦だといいが

94:ニュースソース検討中@自治議論スレ
19/07/12 18:03:37.77 y4wefbNr.net
>>3
タイ語って読み書きするのがかなり難しいんだよね
文字の発音に法則はあるけど、「結局スペルを丸ごと覚えた方が早い」
とまで言われる
タイ人って特に女性は物凄く勉強するからなあ
そしてハイテクの使いこなしもかなり強い

95:ニュースソース検討中@自治議論スレ
19/07/12 18:38:04.48 gdM6P/3Z.net
昔の知識層は達筆すぎてなぁ
全く歯が立たん

96:ニュースソース検討中@自治議論スレ
19/07/12 19:10:34.07 t8u5o442.net
>>61
たぶんお前が思ってる意味で>>31は発言していないぞ
ps://news.yahoo.co.jp/byline/enokieisuke/20190418-00122843/
時間があったら読んでみてくれ
日本の文系研究に対する姿勢について>>31は語ったんだと思う


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch