青空文庫 12棚目at BOOKS
青空文庫 12棚目 - 暇つぶし2ch2:無名草子さん
23/01/02 15:35:35.36 .net
【青空文庫について】
「青空文庫、充電中」
URLリンク(www.aozora.gr.jp)
青空文庫早わかり
URLリンク(www.aozora.gr.jp)
青空文庫のしくみ
URLリンク(www.aozora.gr.jp)
青空文庫収録ファイルの取り扱い規準
URLリンク(www.aozora.gr.jp)
青空文庫FAQ
URLリンク(www.aozora.gr.jp)
耕作員を志願される皆さんへ
URLリンク(www.aozora.gr.jp)
青空文庫への作品収録を望まれる方へ
URLリンク(www.aozora.gr.jp)
図書カード:青空文庫の提案 (青空文庫)
URLリンク(www.aozora.gr.jp)
図書カード:「天に積む宝」のふやし方、へらし方 (富田 倫生)
URLリンク(www.aozora.gr.jp)
青空文庫 - Wikipedia
URLリンク(ja.wikipedia.org)

3:無名草子さん
23/01/02 16:27:20.96 .net
【主な青空文庫の関連・派生サイト(順序不同)】
本の未来基金
URLリンク(honnomirai.net)
aozorahack
URLリンク(aozorahack.org)
えあ草紙・青空図書館 ◀ 青空文庫
URLリンク(www.satokazzz.com)
青空WING
URLリンク(aozorawing.osdn.jp)
ふりがな文庫
URLリンク(furigana.info)
青空朗読
URLリンク(aozoraroudoku.jp)

4:無名草子さん
23/01/02 16:28:23.23 .net
【主な青空文庫の類似サイト(順序不同)】
国立国会図書館デジタルコレクション
URLリンク(dl.ndl.go.jp)
Wikisource
URLリンク(ja.wikisource.org)<)
うわづら文庫
URLリンク(www.let.osaka-u.ac.jp)
科学図書館
URLリンク(www.cam.hi-ho.ne.jp)
PD図書室
URLリンク(books.salterrae.net)
コンプリート・シャーロック・ホームズ
URLリンク(221b.jp)

5:2023年1月公開予定作品一覧
23/01/02 16:32:07.46 .net
2023-01-01 尾崎 士郎『現代語訳 平家物語 14 解説』
2023-01-02 原 民喜『檀一雄「リツ子・その死」 ―創芸社刊―』
2023-01-03 ワインバウム スタンリー・G『もしも世界 マンダプーツシリーズ 第1回』

6:そらもよう
23/01/02 16:33:02.24 .net
2023年01月01日 『電子アーカイヴ』はしばし電気をためて夢を見る
URLリンク(www.aozora.gr.jp)

7:無名草子さん
23/01/02 16:49:41.85 .net
>>1乙です、あらためてどうもありがとう

8:無名草子さん
23/01/02 16:52:02.00 .net
前スレ989
そうそう、「こちら」がやらなきゃなんないの「こちら」ってのは、青空文庫サイドのこと。
前スレ989の言う通り、この作業は大変な負荷なんだよ

9:無名草子さん
23/01/02 16:55:18.43 .net
(送信してしまった)
だから「かもしれない」程度の誤植報告を気軽に受け付けるのは、いたずらに青空文庫側の作業負担を増やすだけ。

10:無名草子さん
23/01/02 17:17:07.74 .net
OCRを校正に使えると思ってる人って、なんというか思い込みが烈しいね

11:無名草子さん
23/01/02 17:23:26.04 .net
納めるものの品質さえちゃんとしてれば
各自が有用と思えるものを使えばいいだけのこと
他人がとやかく言うことではない
まして人格否定する必要はない

12:無名草子さん
23/01/02 17:24:05.03 .net
君が使えないと思うなら使わなければいい
君に使えとは誰も言ってないよ

13:無名草子さん
23/01/02 17:31:45.54 .net
OCRは初期工程の入力として使うものであって、およそ最終工程の校正に使うものではないよ
OCRを校正に使うなんて、AIの回答を信じるのと同じくらい間違っている

14:無名草子さん
23/01/02 17:39:30.70 .net
信用できるOCRデータあるんなら最初からそれをベースにして入力しなよ、という話なんだが、
なぜOCRを校正で使おうとするのか

15:無名草子さん
23/01/02 17:51:22.99 .net
>>14
既に誰かが入力に着手してたら校正しか出来ないじゃん
仮名遣いコンプリートするなら別かもしれないけど

16:無名草子さん
23/01/02 17:58:39.08 .net
個々人がやりやすいようにすれば良い
筋トレ10分後に30分校正をx3セットするとか変なパターンでも何でもいい

17:無名草子さん
23/01/02 18:03:06.17 .net
なんだろう
一部の人は、今流行りの活字書体で重版された旧作品ばかり入力対象にしようとするからOCRの欠点に気づけないのだろうか

18:無名草子さん
23/01/02 18:07:28.76 .net
俺だけが知っている世界の真実みたいな書き方する奴の何と気持ち悪い事か

19:無名草子さん
23/01/02 18:10:38.83 .net
「こいつはモノを知らない」と言ってるのを理解できず「俺(発言者)だけが知ってる」と解釈することで正当化する思考

20:無名草子さん
23/01/02 18:13:51.32 .net
>>18
逆だよ、俺だけ知らない世界の真実
社会の窓が開いていることに気づけない、うっかりさん

21:無名草子さん
23/01/02 18:32:25.63 .net
>>20
家では蒸れないように社会の窓開けっぱなしにしてるオッサンは俺です
ポロリしてないんだけど当然家族には大不評

22:無名草子さん
23/01/02 18:35:56.78 .net
今月の公開は3ヶ日だけなのか

23:無名草子さん
23/01/02 18:39:08.84 .net
前スレ
>>995
> そもそも自分でチェックせずになぜ誤字と判断できるのかわからんな
> 「誤字かも」「誤字な気がする」とかそんなレベルの連絡に対応するの> は人手があればやれるのは確かだが
> だとしても本来、やる筋合いはない。
だって、読んでて明らかに日本語としておかしいんですもの。
まさか作者がこんな間違いを犯すわけないと思うと
入力、校正でのミスを疑ってしまいますわ。
そういうのを集めてコレクションしておくのが趣味なんですの。

24:無名草子さん
23/01/02 18:40:39.17 .net
>>19
あ・・・お察し

25:無名草子さん
23/01/02 18:48:08.05 .net
ベルマークみたいに集めた入力・校正ミスの量に応じて図書カードポイントになったらすばらしいよなあ

26:無名草子さん
23/01/02 18:51:19.36 .net
>>25
数人で協力されたら終わりやね

27:無名草子さん
23/01/02 19:41:27.86 .net
OCRが有用かどうかより
なんで荒れるとわかってる話をわざわざすんのか意味わからん

28:無名草子さん
23/01/02 19:43:02.24 .net
>>23
釣りに釣られてあげるとさ
君がコレクションしたらいいよ
君が自分で確認してね

29:無名草子さん
23/01/02 19:44:38.19 .net
>>16
わろた

30:アメジスト夫人
23/01/02 19:47:14.40 .net
>>28
ええ、誰にもやっていただけないんでしたら
いずれそうできたら良いと思ってますわ
でも青空文庫にフィードバックはいたしませんわよ

31:無名草子さん
23/01/02 19:47:57.95 .net
それでいい

32:無名草子さん
23/01/02 19:50:08.84 .net
年明けて工作員のやることがなくなったからかみんなクサクサしてるなあ

33:無名草子さん
23/01/02 19:50:53.48 .net
すでにそういう奇特な人もいるだろう
だとして何故報せない!とも思えない

34:無名草子さん
23/01/02 19:54:18.26 .net
>>32
自分は昨年中に申請した担当作品持ってるので気分的には助かってる
年内申請のものは年内にと決めて取り組んでたが
今年は12月になってプライベートが小忙しくなって
納品できなかったのが逆に幸いした……

35:無名草子さん
23/01/02 19:58:32.29 .net
ここをみてるとそのうち青空文庫が開設する工作員向け情報掲示板が荒れるのか、それともみんな礼儀正しく振る舞えるのか
気になります

36:無名草子さん
23/01/02 20:03:05.01 .net
そりゃそこでは匿名ではなくなるし
キャリアの有無(≠スキルの有無であるとはいえ)も発言の重みに加わってくる

ここでは書き込み者さんが耕作員かどうかもわからないし
中を知っての発言かどうかもわからないから荒れる

37:無名草子さん
23/01/02 20:04:48.46 .net
まあ筋トレしようぜ

38:無名草子さん
23/01/02 20:15:07.04 .net
工作員が筋力トレーニングって何か意味合いが変わるね

39:アメジスト夫人
23/01/02 20:18:24.08 .net
ですから前スレでワッチョイ導入して欲しいなんて言いましたが
板単位の話ですのでどうしようもないですわね
>>1 を建ててからふと思ったのですがこれはもう仕方ないですわね

40:無名草子さん
23/01/02 20:36:46.10 .net
あらこちら、夫人のスレでいらしったの
それは失礼いたしましたわ

41:無名草子さん
23/01/02 20:37:51.95 .net
>>32
クサクサはしてないけど普通に入力中校正中合わせて3桁作品くらい作業が積もってる……

42:無名草子さん
23/01/02 20:39:46.26 .net
中の人、このスレ見てるのかな?
割と大物な作品を初めて工作員として申請したんだけど、どうなるんだろう
青空文庫でテキストサイズが一番大きい「大岡政談」の次に大きくなる見込み

43:42
23/01/02 20:48:53.55 .net
Windowsのサクラエディタで入力してるんだけど、漢字を確認しやすいようにMS ゴシックのフォントサイズを18にしてる。
旧字の多い作品、みなさんどうしてます?

44:無名草子さん
23/01/02 20:48:53.86 .net
他のスレみたけどこの板でもIDなら付けられるっぽいね
といってもIDだけだと同日の同一人物が書き込みしたって証明にしか使えないから立て直すほどではないし、次スレ立てる頃に覚えられてたら付けられるかどうかって程度か

45:アメジスト夫人
23/01/02 20:58:25.83 .net
>>40
いいえ、どういたしまして。私は某婦人よりは優しいので
アンチにタワシコロッケをご馳走なんていたしませんの。

46:無名草子さん
23/01/02 21:19:01.06 .net
>>43
前スレでいろいろ質問したド素人の私ですが、
メモ帳機能でMSゴシックのサイズ12で入力してました。
新字に直すのが面倒なのでだいたい旧字をそのまま入力してましたが、
印刷して確認したり校正ツールを通したりしながら体当たりでやってました。

47:無名草子さん
23/01/02 21:22:05.87 .net
>>37
余力のある人は古本屋巡りや通販サイトや図書館で入れたい作家や作品の品定めをするといいかも
展覧会図録や美術書は、他の人がめったに入れない画家や評論家の文章が載ってることあるから意外と穴場

48:無名草子さん
23/01/02 21:24:34.69 .net
いいね。
入力に着手しないまでも、スキャンだけしとくと
来年の今日あたりはすぐに取りかかれてヒャッハーよ

49:無名草子さん
23/01/02 21:24:39.76 .net
>>43
新字(弁とかは旧字)で入力して旧字に一括変換

50:無名草子さん
23/01/02 21:25:12.35 .net
>>49
これ

51:42
23/01/02 21:33:07.20 .net
>>46
旧字で入力となるとIMEパッドでしょうか。
私は渋々IMEパッドです。中国の漢字も拾いやすくなるよう「Hand Writing(CH)」設定も時々使います

52:アメジスト夫人
23/01/02 21:39:37.13 .net
あらあら、これもまたOCR勢と手入力勢とで意見が分かれそうですわね。
なんだか楽しそうですこと、オホホホホ。

53:無名草子さん
23/01/02 21:44:59.13 .net
OCR入力で文句を言ったり人格否定をしたりする人はいないと思う

54:無名草子さん
23/01/02 21:46:36.02 .net
>>51
変換して出るものは変換して出して、分からなければIMEパッド、もしくは部首で見当を付けてググって調べます。
(まあ、大体出てこない場合は外字注記のお世話になることが多いですが……)

55:無名草子さん
23/01/02 21:47:12.56 .net
今はみなさん旧字旧仮名についてお話をしてらっしゃるのよ夫人
旧旧文に関してはOCRは有用ではありませんから
ご心配には及びませんわ

56:42
23/01/02 21:48:23.63 .net
私はOCRの出力したテキストから校正していく入力スタイル。
OCRが難しい旧字を正確に検出できていたりすると逆にすごいなと感心するほう。
難しい旧字をIMEパッドで探せない時やマウス操作に疲れている時は、以下の漢字検索サイトを使ってます。
漢字検索|字源 - jigen.net
URLリンク(jigen.net)

57:無名草子さん
23/01/02 21:59:53.55 .net
NDLOCRは旧字旧仮名入力に有用そうだけどit音痴だから自分の環境で構築できるかわからん
いずれやりたい

58:42
23/01/02 22:22:22.45 .net
>>57
私は次世代デジタルライブラリーのOCRテキストデータをダウンロードして使っているので、NDLOCRは直接使ってません。
OCRソフト「読取革命Ver.16」をすでに持っていますが、著作権が有効なとある作品を自炊するのに使いましたが、今回は使ってないです。

59:42
23/01/02 22:34:31.37 .net
撮影機材が何もない環境で非破壊的な自炊を達成すべくスマホで写真撮影し続けると腰が痛くなる、
OCRソフト「読取革命Ver.16」は結構使える、という、知見が得られたのだけど、
次世代デジタルライブラリーのOCRテキストデータをダウンロードできると知って拍子抜けした次第

60:無名草子さん
23/01/03 07:00:52.78 .net
>>47
それから、戦前戦後の古い雑誌の寄稿やアンケート記事も思いがけない人物が執筆・回答していることがあるし、
そうした文章はだいたい短いから入れやすくてオススメ

61:無名草子さん
23/01/04 07:12:53.29 .net
4日の新着はないのか

62:無名草子さん
23/01/04 09:20:33.18 .net
もしも世界ってなに?

63:無名草子さん
23/01/04 10:13:22.26 .net
三が日だけかと思ってたら意外と公開予定多くて安心した
しかも新しい作家が二人も……

64:2023年1月公開予定作品一覧
23/01/04 12:00:07.76 .net
2023-01-05 津村 信夫『果物の木の在所』※誕生日
2023-01-07 左川 ちか『緑色の透視』※命日、作品初公開
2023-01-10 坂口 安吾『大阪の反逆 ―織田作之助の死―』※織田作之助命日(作之助忌)
2023-01-13 畔柳 二美『おもしろい話』※命日、作品初公開

65:無名草子さん
23/01/04 13:30:52.87 .net
>>62
読めば良いじゃん

66:青空文庫アクセスランキング
23/01/06 12:10:44.94 .net
2022年12月
XHTML版
URLリンク(www.aozora.gr.jp)
テキスト版
URLリンク(www.aozora.gr.jp)

67:青空文庫アクセスランキング
23/01/06 12:11:46.70 .net
2022年通年
XHTML版
URLリンク(www.aozora.gr.jp)
テキスト版
URLリンク(www.aozora.gr.jp)

68:無名草子さん
23/01/06 14:32:33.46 .net
ドグラ・マグラは伝説だけで皆一度は落とすけど読まないように思われるが読んでる人いる?

69:無名草子さん
23/01/06 16:59:24.12 .net
チャカポコしはじめたらページめくるだけになった思い出

70:無名草子さん
23/01/06 21:04:30.88 .net
ドグラマグラ2回落として消した
読まずに・・・・・・だって他に読みたいもの有るからね
そのときは羅生門とかね
羅生門は書かれた時代背景を知らないと意味わからないで終わりそうだな

71:無名草子さん
23/01/06 21:45:09.43 .net
読もう読もうと思って読んでない

72:無名草子さん
23/01/06 21:49:08.78 .net
最後まで読んだらおかしくなるから結果的に挫折した人の話しか聞かない可能性がある

73:無名草子さん
23/01/06 22:06:01.75 .net
2022年通年XHTML版見てみたけど、なぜ「巌頭の感」が500位以内に……?
5月から突如ランキングに躍り出て、7月からはずっとランキング入りしてるし……

74:無名草子さん
23/01/06 23:22:38.94 .net
ドグラ・マグラって今ではああそんな感じのたまにあるよねっと言われるような構想倒れの小説じゃない?

75:無名草子さん
23/01/06 23:36:54.20 .net
>>73
元々有名な遺書だし
500位台ってちょうどそれくらいの知名度の作品がウロウロしててたまに偶然アクセス数が少し増えて500位以内にランクインするみたいな感じじゃない?
501行以降のアクセス数を知らないから推測なんだけど……
一応Wikipediaの藤村操の記事の2022年1月1日から12月31日までの閲覧数を調べたら85,625ページビュー(命日の5月25日が2,367でトップ)だったから
Wikipedia見た約5%が外部リンクから青空文庫に来て作品読もうとしただけでも4,000くらいのアクセス数は稼げることになる

76:無名草子さん
23/01/07 03:52:12.69 .net
夢野久作ってちゃんと構想練って作品書いてるのかな

77:無名草子さん
23/01/07 07:33:17.12 .net
チャカポコのあたりは読むのが辛かったが、そこを越えて最後まで読んだら面白い小説を読んだという満足感があった

78:無名草子さん
23/01/07 15:52:07.07 .net
>>75
なるほど……
Wikipediaから来た可能性は意識していませんでした。
メジャーなサイトにリンクが貼られると、アクセス人気度は高まりますね。

79:75
23/01/07 16:51:38.57 .net
>>78
まぁTwitterで調べた感じだとアクセス数増えそうな原因が無さそうで
他に何か要因になりそうなのはあるかなと思って思い付いたのがWikipediaだっただけなので
全く別のところで話題になった可能性もあるけど……

80:無名草子さん
23/01/07 17:20:23.72 .net
舞台裏もなにも動いてないね……

81:無名草子さん
23/01/08 13:01:30.55 .net
学校での名作読書に青空文庫が指定されるのが増えるかもな
あと紙媒体高すぎ問題

82:無名草子さん
23/01/08 23:18:36.96 .net
ドグラ・マグラはaudibleで聴けるからみんな頭がおかしくなるがいい

83:無名草子さん
23/01/08 23:35:09.62 .net
聞きたくないwwwスチャラカチャカポコwww

84:無名草子さん
23/01/08 23:58:07.84 .net
ラップのリズムでドグラ・マグラ
スチャッ!
カチャカチャ
ポーンポーン!

85:無名草子さん
23/01/09 09:07:33.28 .net
キチガイ天国化しとおる・・・

86:無名草子さん
23/01/09 09:10:15.89 .net
式年遷宮と充電期間に関する新しい情報まだ?

87:無名草子さん
23/01/09 11:18:10.63 .net
まだ2023年になってから1週間ちょっとなんだが……

88:aozorablog
23/01/09 12:10:12.31 .net
青空文庫’22/11月-’22/12月の月間アクセス増率分析
URLリンク(www.aozora.gr.jp)

89:無名草子さん
23/01/09 15:30:51.14 .net
まぁヤキモキする気持ちはわかる
自分もそうだし
今は見守るしかないが

90:無名草子さん
23/01/09 17:35:18.52 .net
校正待ちのままの作品をフォーマットを改めてWikisourceに転載しとこうかと思ったけど
アメリカの著作権法も考慮しないと行けない関係で掲載できないのが割とあるな……
(特に1946年1月1日以降に亡くなった著作者)

91:42
23/01/11 16:13:32.00 .net
自分で校正してママ注記やら外字注記やらいろいろ追加しているうちに青空文庫テキストが2001KBになってしまった
充電期間長いようなら、青空文庫よりUnicode文字を普通に使えるWikisourceのほうがいいのかな
Wikisourceなら校正者の負担軽そうだし

92:無名草子さん
23/01/11 16:35:13.24 .net
電書サイトで無料ないし有料で出してもいい
ちゃんと著作権の調査はするべきだが
青空文庫がリニューアルしたらそこにも入れたらよい

93:42
23/01/11 18:14:03.59 .net
>>92
助言ありがとう
使用した底本は国立国会図書館デジタルコレクションであり「血税」なので電書サイトで出すとしても無料ですね(笑)

94:無名草子さん
23/01/11 19:52:59.15 .net
ウィキソースって校正制度があるんだな
しかも未校正のものと、1人が校正したものと、2人が校正したもので区分されてる

もっとも古いというだけで没年の検討をしてないような作品も堂々と載ってたりするから手放しで褒められるものではないけど

95:無名草子さん
23/01/11 20:05:27.25 .net
エバラソースと誤認した

96:無名草子さん
23/01/11 21:35:25.32 .net
そういえば、1月分の公開予定が追加されたね
毎月10作品前後、とは言ってたけど11作品は今月少なくとも公開されるのか

97:42
23/01/11 23:54:51.78 .net
>>94
私は「自分は入力者」という感覚があまりなくて、
おっちょこちょいな入力者「OCR」の提出したデータに対する「一人目の校正者」のような感覚なんですが
それではダメですか、そうですか

98:無名草子さん
23/01/12 13:20:05.90 .net
入力作業なのに校正しかやってない感覚は確かにある

99:無名草子さん
23/01/12 23:32:58.26 .net
[第3話]漫古☆知新-バカでも読める古典文学- - 漫☆画太郎 | 少年ジャンプ+
URLリンク(shonenjumpplus.com)
図書カード:鼻 (ゴーゴリ ニコライ)
URLリンク(www.aozora.gr.jp)

100:無名草子さん
23/01/13 08:04:23.97 .net
毎度毎度素晴らしすぎる

101:42
23/01/14 14:26:40.37 .net
青空文庫よりも先にWikisourceに作品をあげる準備として作者の項目を作って国立国会図書館デジタルコレクションのpdfをアップロードしたんだけど、
ライセンスがどうやらこうたらで一週間後にそのpdfファイルが消されるかもしれないらしい
pdfがなくても作品テキストは書き込めるはずだからひとまず静観
底本の文章折り返しを維持したままhtml化できるのは、青空文庫にないWikisourceの優位性だと思う

102:無名草子さん
23/01/14 15:03:06.32 .net
何を論点とした話か知らんが「インターネット公開(保護期間満了)」なら出典を明記しとけば転載申請は原則として要らんはずだけど

103:42
23/01/14 15:28:58.72 .net
>>102
助言ありがとう。以下のパブリックドメイン設定を追加して様子見る予定。
{{PD-old-auto-expired|deathyear=1908}}
{{PD-Japan}}
校正は終わってるんだけど、入力中にうっかり無くしてしまった底本の文章折り返し情報の復元&Wikisource向けテキスト作成にに着手するので静観で無問題
pdfのアップロード先は以下URL
URLリンク(commons.wikimedia.org)

104:42
23/01/14 16:26:51.43 .net
>>103 のURLで閲覧できる底本は割り注が巨大なことが原因で
有名なビューワーがクラッシュする問題があって適度な長さに分割&改行しないとダメな感じ。
「ルビなんて飾り。私に読めない漢字なんてありません」と自負する人の心を確実にへし折る作品だし。
表や系統図を青空文庫の罫線で再現するのは制約があるのだけど、
表についてはHTMLテーブル使えるWikisourceが青空文庫より見やすいだろうと思う。まだ試してないけど。

105:無名草子さん
23/01/14 20:35:49.59 .net
ウィキソースの新しい作品見たら1つ目から没年明記せずに「没後100年以上経過してるからパブリックドメイン」とか言って載せてて無法地帯感が凄い
Wikipediaに記事がないどころかググっても出てこねぇし

106:無名草子さん
23/01/14 23:01:23.61 .net
作業がストップになって別の趣味に注力するとか自分の関わってない作品を読むとかじゃなくて別のプラットホームで作業し続けるって凄いな

107:42
23/01/15 01:23:22.88 .net
今は、Wikisource向けのテキストの構成を考え中。
青空文庫とちがってHTML形式なので、リンク先に飛ぶ機能を使わない手がない。
底本ページごとに1ページ作る方式は取らず青空文庫HTMLと同じように1つの巨大HTMLにする予定。
理由としては、HTMLファイルが巨大であってもページ内ジャンプできれば不便ではないし、
作品全体に対するキーワード検索をWebブラウザの検索機能だけで実現できる利便性は大きい。
ちなみに、作品を読んだことある人なら割り注にルビをつけたくなると思うけど、今はその衝動を抑える必要がある。

108:2023年1月公開予定作品一覧
23/01/15 14:15:44.62 .net
2023-01-16 坂口 安吾『被告席の感情』
2023-01-17 牧 逸馬『斧を持った夫人の像』
2023-01-23 三角 錫子『七里ヶ浜の哀歌』
2023-01-24 大石 誠之助『外交の後援 (敵愾にあらず至誠にあり)』

109:aozorablog
23/01/15 17:40:11.11 .net
青空文庫 2021年-2022年の年間アクセス増率分析
URLリンク(www.aozora.gr.jp)

110:無名草子さん
23/01/15 19:28:56.89 .net
>>108
今月そんだけ?

111:無名草子さん
23/01/15 20:10:18.69 .net
>>110
月10作品程度公開って言ってたから、今年は毎月その程度になるんじゃないかな
ちなみに23日は『七里ヶ浜の哀歌』の題材となった水難事故の発生日だよ

112:無名草子さん
23/01/17 00:04:07.08 .net
校了済みの作品は200弱くらいあるけどそれを全放出しないのはリニューアル後のストックも考えてるからだろうか

113:無名草子さん
23/01/17 01:05:35.26 .net
単に省力化でしょ。
公開するだけでも色々決まった作業はあるはずだから

114:42
23/01/17 11:35:06.56 .net
世間では「宇宙戦艦」を国会図書館デジタルコレクションで全文検索するのが流行っているみたいだが、
ぜひとも以下URLの示した「母を食はんと話し合ひ」の検索結果もみてほしい
URLリンク(lab.ndl.go.jp)

115:無名草子さん
23/01/17 11:42:50.90 .net
はじめて聞いたその流行り
どういうプレイなのか謎

116:42
23/01/17 11:53:44.28 .net
>>115
#NDL全文検索 対象テキストに含まれている「宇宙戦艦」以外のイースターエッグを見つけた方はぜひお教えくださいッ #次々デジ備忘録 #図デコファントム - 日本語練習虫
URLリンク(uakira.hateblo.jp)

117:無名草子さん
23/01/17 19:09:32.31 .net
はえ~
謎の誤認識を探すプレイか
ありがとう

118:無名草子さん
23/01/17 19:10:37.50 .net
モンゴメリ早く出ないかな
あしながおじさんと属あしながおじさんも最初の翻訳者死亡で50年たってるから出してほしい
WHホジソンの夜の声、もSFマガジン版が翻訳者が74年死亡で来年切れるから、電子書籍にしてほしいなー
出来れば全作読みたいけど

119:無名草子さん
23/01/17 19:19:33.23 .net
青空文庫でマタンゴとか最高じゃん

120:無名草子さん
23/01/17 20:38:03.32 .net
>>118
きみいつの話をしてる?

121:無名草子さん
23/01/17 20:54:16.72 .net
「ばあさんや、公開はまだかのう……」
『おじいさん、保護期間はもう延びたでしょ。』

122:42
23/01/17 21:45:18.37 .net
なあに、OCRで校正する危うさを学ぶ良い機会

123:aozorablog
23/01/17 21:57:32.08 .net
青空文庫2022年度新規公開作品の一日当りアクセス数ランキング
URLリンク(www.aozora.gr.jp)

124:無名草子さん
23/01/17 23:23:56.02 .net
>>122
君が不満なら使わなければ良いだけの話をなぜ蒸し返すの
あと名前欄

125:無名草子さん
23/01/17 23:26:46.69 .net
関連性のないレス間でいつまでも固定ハンドル使わなくてもいいよ……

126:42
23/01/17 23:52:16.44 .net
国デジは校正好きな人にはたまらない大海原だと思うけど、いかんせん縦書書籍だとjsonファイルのXY座標を適切に変換しないと読むのが辛いと思う
自分は変換スクリプトを自作して横書に再配置したテキストファイルのを入力に使ったけど、そういう手段を持たない人は辛いかも

127:無名草子さん
23/01/18 00:14:21.11 .net
このスレは42のブログになりました。

128:42
23/01/18 01:10:22.59 .net
目下、上段要約見出しをどうするか検討中
青空文庫の同行見出しのような手法を取る予定だけど普通の小見出しのほうが良いだろうか。
あと、ちなみに >>103のpdfファイルのページに割と大きめなテーブルを追記したので、興味ある人見てみて
テーブルとかリンクは青空文庫にない強みだよなあと改めて実感

129:無名草子さん
23/01/18 01:21:14.55 .net
スレ違いだし
ウィキソーススレ探すなり立てるなりしてそっちでやって下さいよ
このところのあなたの書き込みは
他サイト関連の書き込みばかり

130:42
23/01/18 01:35:46.92 .net
>>129
Wikisourceはそこまで無関係ではないと思うよ
青空文庫形式からWikisource形式に変換する自動ツールがあるみたいだし

131:無名草子さん
23/01/18 08:24:20.08 .net
無関係じゃないだけで青空文庫ではないですよね?
底本によく使われてるから無関係じゃないって理由でこのスレで岩波文庫の話するんですか?

132:無名草子さん
23/01/18 09:18:24.35 .net
まぁこの調子で行くと延々とウィキソースの話をされそうだしな
ただ肝心の青空文庫の動きがないから手持ち無沙汰になっちゃうのは分かる

133:42
23/01/18 09:37:10.45 .net
できることが青空文庫 ⊂ Wikisource のような包含関係になってるってのが現実。
Wikisourceで入力する時は、のちの青空文庫への移植を想定して、青空文庫でできないことを意識しておく必要あるでしょ。
手持ち無沙汰でWikisourceで先にやっとくか的な人は特に。

134:無名草子さん
23/01/18 11:54:01.49 .net
いずれにせよウィキソースで作業したその時々の備忘録ならウィキソースの利用者ページに書いとけよ
青空文庫スレに書き込みたいならせめて1つのまとまったレポートにまで昇華してからにしてくれ

135:無名草子さん
23/01/19 12:32:18.59 .net
東健而(昭和8年没)訳の『蚊とんぼスミス』(あしながおじさん)はパブリックドメインになっとるよ
村上文樹訳『若き世界』(続あしながおじさん)も作者の没年がわからんが戦中発表なのでかなりの確率でいけそう
>>118の意図とは違うだろうけれど

136:無名草子さん
23/01/19 15:57:04.70 .net
青空文庫で外字画像を使う場合の注記はあるのでしょうか
URLリンク(github.com)
AozoraEpub3では画像注記の頭に、※をつけるだけで外字画像として認識する。

※[#画像(あに濁点.png、横218×縦218)入る]
ここでは外字画像の形式は電書協EPUBを参考にして、透過pngで横218×縦218にしている。

137:無名草子さん
23/01/19 19:53:59.37 .net
権利者不明「孤児作品」問題の解決に一歩 文化庁が提案する新制度をひもとく:小寺信良のIT大作戦 - ITmedia NEWS
URLリンク(www.itmedia.co.jp)

138:無名草子さん
23/01/20 12:07:59.40 .net
ところで皆さんは、
「青空文庫にこんなのもあるのか!」と思った
作品や作家さんってありますか?
(ちなみに私は著名作家のアンケートや未定稿が沢山あって驚きました)

139:無名草子さん
23/01/20 22:06:40.50 .net
こんなのもあるのかと思ったことはないけど文庫本1冊レベルの分量の作品があると「よくこんなの作業したな」とは思う
文庫本10~20ページレベルでも割と重労働だし

140:無名草子さん
23/01/20 22:07:46.81 .net
>>138と同じようなことだろうけど、前書きだけといったものがあるのが驚きだった。
どういう意図で入力したのだろうと気になった。
(青空文庫に収録する価値があると考えたのか、手軽く完成させられるからなのか等)

141:無名草子さん
23/01/20 22:38:51.77 .net
>>140
序文とかアンケートみたいや全集なら最終巻の雑篇あたりに収録されるタイプの作品をいくつか入力したことあるけど
大体以下の理由で入力してたよ

・本来入力したい本編とか同じ雑誌に掲載されてる作品の申請のついで
・それ自体が独立して有名になってたり有名なフレーズが入ってたりする
・元々Wikipediaに記事があるような人だけど著述家じゃないのでそういうのしか文章が残ってない(収録作品数もだけど収録作家数も増やしたいじゃん?)
・本文が共著や共編とかで著作権が切れてないけど、序文は個人名義でパブリックドメインが確定してるし、そういう本があるという備忘録を兼ねて
・短いので校正の練習に使ってくれたらなぁ……

142:141
23/01/20 22:49:32.20 .net
みたいや→みたいな

143:無名草子さん
23/01/21 00:27:24.48 .net
序文は作家の交友関係も現れて面白いよね
この作家はあの作家と繋がりあったんだ!みたいな発見がある

144:無名草子さん
23/01/21 00:59:31.45 .net
>>141
入力者ナマの声嬉しいなぁ
なるほどありがとう!

145:無名草子さん
23/01/21 08:58:44.74 .net
>>141
自分も耕作員の一人だけど、
短いのは入れやすいし、意外な人物が書いてる(特にアンケート記事)事が多いから、積極的に入れてたなぁ
編年体の大正文学のアンソロジーには、初出誌からそのまま抜き出した詩編や短歌が収録されてるからそこもチェックしつつ入れてた思い出

146:aozorablog
23/01/21 18:09:28.49 .net
青空文庫前々年(2021年)公開作品の2021年、22年累計一日当りアクセス数ランキング
URLリンク(www.aozora.gr.jp)

147:無名草子さん
23/01/21 21:55:03.47 .net
>>146
山本周五郎や江戸川乱歩、山川方夫は人気なんだなぁ
60年代没で比較的現代に近い作家だし……

148:無名草子さん
23/01/21 23:22:50.23 .net
江戸川乱歩は初期作品だけ好き


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch