青空文庫 12棚目at BOOKS
青空文庫 12棚目 - 暇つぶし2ch100:無名草子さん
23/01/13 08:04:23.97 .net
毎度毎度素晴らしすぎる

101:42
23/01/14 14:26:40.37 .net
青空文庫よりも先にWikisourceに作品をあげる準備として作者の項目を作って国立国会図書館デジタルコレクションのpdfをアップロードしたんだけど、
ライセンスがどうやらこうたらで一週間後にそのpdfファイルが消されるかもしれないらしい
pdfがなくても作品テキストは書き込めるはずだからひとまず静観
底本の文章折り返しを維持したままhtml化できるのは、青空文庫にないWikisourceの優位性だと思う

102:無名草子さん
23/01/14 15:03:06.32 .net
何を論点とした話か知らんが「インターネット公開(保護期間満了)」なら出典を明記しとけば転載申請は原則として要らんはずだけど

103:42
23/01/14 15:28:58.72 .net
>>102
助言ありがとう。以下のパブリックドメイン設定を追加して様子見る予定。
{{PD-old-auto-expired|deathyear=1908}}
{{PD-Japan}}
校正は終わってるんだけど、入力中にうっかり無くしてしまった底本の文章折り返し情報の復元&Wikisource向けテキスト作成にに着手するので静観で無問題
pdfのアップロード先は以下URL
URLリンク(commons.wikimedia.org)

104:42
23/01/14 16:26:51.43 .net
>>103 のURLで閲覧できる底本は割り注が巨大なことが原因で
有名なビューワーがクラッシュする問題があって適度な長さに分割&改行しないとダメな感じ。
「ルビなんて飾り。私に読めない漢字なんてありません」と自負する人の心を確実にへし折る作品だし。
表や系統図を青空文庫の罫線で再現するのは制約があるのだけど、
表についてはHTMLテーブル使えるWikisourceが青空文庫より見やすいだろうと思う。まだ試してないけど。

105:無名草子さん
23/01/14 20:35:49.59 .net
ウィキソースの新しい作品見たら1つ目から没年明記せずに「没後100年以上経過してるからパブリックドメイン」とか言って載せてて無法地帯感が凄い
Wikipediaに記事がないどころかググっても出てこねぇし

106:無名草子さん
23/01/14 23:01:23.61 .net
作業がストップになって別の趣味に注力するとか自分の関わってない作品を読むとかじゃなくて別のプラットホームで作業し続けるって凄いな

107:42
23/01/15 01:23:22.88 .net
今は、Wikisource向けのテキストの構成を考え中。
青空文庫とちがってHTML形式なので、リンク先に飛ぶ機能を使わない手がない。
底本ページごとに1ページ作る方式は取らず青空文庫HTMLと同じように1つの巨大HTMLにする予定。
理由としては、HTMLファイルが巨大であってもページ内ジャンプできれば不便ではないし、
作品全体に対するキーワード検索をWebブラウザの検索機能だけで実現できる利便性は大きい。
ちなみに、作品を読んだことある人なら割り注にルビをつけたくなると思うけど、今はその衝動を抑える必要がある。

108:2023年1月公開予定作品一覧
23/01/15 14:15:44.62 .net
2023-01-16 坂口 安吾『被告席の感情』
2023-01-17 牧 逸馬『斧を持った夫人の像』
2023-01-23 三角 錫子『七里ヶ浜の哀歌』
2023-01-24 大石 誠之助『外交の後援 (敵愾にあらず至誠にあり)』

109:aozorablog
23/01/15 17:40:11.11 .net
青空文庫 2021年-2022年の年間アクセス増率分析
URLリンク(www.aozora.gr.jp)

110:無名草子さん
23/01/15 19:28:56.89 .net
>>108
今月そんだけ?

111:無名草子さん
23/01/15 20:10:18.69 .net
>>110
月10作品程度公開って言ってたから、今年は毎月その程度になるんじゃないかな
ちなみに23日は『七里ヶ浜の哀歌』の題材となった水難事故の発生日だよ

112:無名草子さん
23/01/17 00:04:07.08 .net
校了済みの作品は200弱くらいあるけどそれを全放出しないのはリニューアル後のストックも考えてるからだろうか

113:無名草子さん
23/01/17 01:05:35.26 .net
単に省力化でしょ。
公開するだけでも色々決まった作業はあるはずだから

114:42
23/01/17 11:35:06.56 .net
世間では「宇宙戦艦」を国会図書館デジタルコレクションで全文検索するのが流行っているみたいだが、
ぜひとも以下URLの示した「母を食はんと話し合ひ」の検索結果もみてほしい
URLリンク(lab.ndl.go.jp)

115:無名草子さん
23/01/17 11:42:50.90 .net
はじめて聞いたその流行り
どういうプレイなのか謎

116:42
23/01/17 11:53:44.28 .net
>>115
#NDL全文検索 対象テキストに含まれている「宇宙戦艦」以外のイースターエッグを見つけた方はぜひお教えくださいッ #次々デジ備忘録 #図デコファントム - 日本語練習虫
URLリンク(uakira.hateblo.jp)

117:無名草子さん
23/01/17 19:09:32.31 .net
はえ~
謎の誤認識を探すプレイか
ありがとう

118:無名草子さん
23/01/17 19:10:37.50 .net
モンゴメリ早く出ないかな
あしながおじさんと属あしながおじさんも最初の翻訳者死亡で50年たってるから出してほしい
WHホジソンの夜の声、もSFマガジン版が翻訳者が74年死亡で来年切れるから、電子書籍にしてほしいなー
出来れば全作読みたいけど

119:無名草子さん
23/01/17 19:19:33.23 .net
青空文庫でマタンゴとか最高じゃん

120:無名草子さん
23/01/17 20:38:03.32 .net
>>118
きみいつの話をしてる?

121:無名草子さん
23/01/17 20:54:16.72 .net
「ばあさんや、公開はまだかのう……」
『おじいさん、保護期間はもう延びたでしょ。』

122:42
23/01/17 21:45:18.37 .net
なあに、OCRで校正する危うさを学ぶ良い機会

123:aozorablog
23/01/17 21:57:32.08 .net
青空文庫2022年度新規公開作品の一日当りアクセス数ランキング
URLリンク(www.aozora.gr.jp)

124:無名草子さん
23/01/17 23:23:56.02 .net
>>122
君が不満なら使わなければ良いだけの話をなぜ蒸し返すの
あと名前欄

125:無名草子さん
23/01/17 23:26:46.69 .net
関連性のないレス間でいつまでも固定ハンドル使わなくてもいいよ……

126:42
23/01/17 23:52:16.44 .net
国デジは校正好きな人にはたまらない大海原だと思うけど、いかんせん縦書書籍だとjsonファイルのXY座標を適切に変換しないと読むのが辛いと思う
自分は変換スクリプトを自作して横書に再配置したテキストファイルのを入力に使ったけど、そういう手段を持たない人は辛いかも

127:無名草子さん
23/01/18 00:14:21.11 .net
このスレは42のブログになりました。

128:42
23/01/18 01:10:22.59 .net
目下、上段要約見出しをどうするか検討中
青空文庫の同行見出しのような手法を取る予定だけど普通の小見出しのほうが良いだろうか。
あと、ちなみに >>103のpdfファイルのページに割と大きめなテーブルを追記したので、興味ある人見てみて
テーブルとかリンクは青空文庫にない強みだよなあと改めて実感

129:無名草子さん
23/01/18 01:21:14.55 .net
スレ違いだし
ウィキソーススレ探すなり立てるなりしてそっちでやって下さいよ
このところのあなたの書き込みは
他サイト関連の書き込みばかり

130:42
23/01/18 01:35:46.92 .net
>>129
Wikisourceはそこまで無関係ではないと思うよ
青空文庫形式からWikisource形式に変換する自動ツールがあるみたいだし

131:無名草子さん
23/01/18 08:24:20.08 .net
無関係じゃないだけで青空文庫ではないですよね?
底本によく使われてるから無関係じゃないって理由でこのスレで岩波文庫の話するんですか?

132:無名草子さん
23/01/18 09:18:24.35 .net
まぁこの調子で行くと延々とウィキソースの話をされそうだしな
ただ肝心の青空文庫の動きがないから手持ち無沙汰になっちゃうのは分かる

133:42
23/01/18 09:37:10.45 .net
できることが青空文庫 ⊂ Wikisource のような包含関係になってるってのが現実。
Wikisourceで入力する時は、のちの青空文庫への移植を想定して、青空文庫でできないことを意識しておく必要あるでしょ。
手持ち無沙汰でWikisourceで先にやっとくか的な人は特に。

134:無名草子さん
23/01/18 11:54:01.49 .net
いずれにせよウィキソースで作業したその時々の備忘録ならウィキソースの利用者ページに書いとけよ
青空文庫スレに書き込みたいならせめて1つのまとまったレポートにまで昇華してからにしてくれ

135:無名草子さん
23/01/19 12:32:18.59 .net
東健而(昭和8年没)訳の『蚊とんぼスミス』(あしながおじさん)はパブリックドメインになっとるよ
村上文樹訳『若き世界』(続あしながおじさん)も作者の没年がわからんが戦中発表なのでかなりの確率でいけそう
>>118の意図とは違うだろうけれど

136:無名草子さん
23/01/19 15:57:04.70 .net
青空文庫で外字画像を使う場合の注記はあるのでしょうか
URLリンク(github.com)
AozoraEpub3では画像注記の頭に、※をつけるだけで外字画像として認識する。

※[#画像(あに濁点.png、横218×縦218)入る]
ここでは外字画像の形式は電書協EPUBを参考にして、透過pngで横218×縦218にしている。

137:無名草子さん
23/01/19 19:53:59.37 .net
権利者不明「孤児作品」問題の解決に一歩 文化庁が提案する新制度をひもとく:小寺信良のIT大作戦 - ITmedia NEWS
URLリンク(www.itmedia.co.jp)

138:無名草子さん
23/01/20 12:07:59.40 .net
ところで皆さんは、
「青空文庫にこんなのもあるのか!」と思った
作品や作家さんってありますか?
(ちなみに私は著名作家のアンケートや未定稿が沢山あって驚きました)

139:無名草子さん
23/01/20 22:06:40.50 .net
こんなのもあるのかと思ったことはないけど文庫本1冊レベルの分量の作品があると「よくこんなの作業したな」とは思う
文庫本10~20ページレベルでも割と重労働だし

140:無名草子さん
23/01/20 22:07:46.81 .net
>>138と同じようなことだろうけど、前書きだけといったものがあるのが驚きだった。
どういう意図で入力したのだろうと気になった。
(青空文庫に収録する価値があると考えたのか、手軽く完成させられるからなのか等)

141:無名草子さん
23/01/20 22:38:51.77 .net
>>140
序文とかアンケートみたいや全集なら最終巻の雑篇あたりに収録されるタイプの作品をいくつか入力したことあるけど
大体以下の理由で入力してたよ

・本来入力したい本編とか同じ雑誌に掲載されてる作品の申請のついで
・それ自体が独立して有名になってたり有名なフレーズが入ってたりする
・元々Wikipediaに記事があるような人だけど著述家じゃないのでそういうのしか文章が残ってない(収録作品数もだけど収録作家数も増やしたいじゃん?)
・本文が共著や共編とかで著作権が切れてないけど、序文は個人名義でパブリックドメインが確定してるし、そういう本があるという備忘録を兼ねて
・短いので校正の練習に使ってくれたらなぁ……

142:141
23/01/20 22:49:32.20 .net
みたいや→みたいな

143:無名草子さん
23/01/21 00:27:24.48 .net
序文は作家の交友関係も現れて面白いよね
この作家はあの作家と繋がりあったんだ!みたいな発見がある

144:無名草子さん
23/01/21 00:59:31.45 .net
>>141
入力者ナマの声嬉しいなぁ
なるほどありがとう!

145:無名草子さん
23/01/21 08:58:44.74 .net
>>141
自分も耕作員の一人だけど、
短いのは入れやすいし、意外な人物が書いてる(特にアンケート記事)事が多いから、積極的に入れてたなぁ
編年体の大正文学のアンソロジーには、初出誌からそのまま抜き出した詩編や短歌が収録されてるからそこもチェックしつつ入れてた思い出

146:aozorablog
23/01/21 18:09:28.49 .net
青空文庫前々年(2021年)公開作品の2021年、22年累計一日当りアクセス数ランキング
URLリンク(www.aozora.gr.jp)

147:無名草子さん
23/01/21 21:55:03.47 .net
>>146
山本周五郎や江戸川乱歩、山川方夫は人気なんだなぁ
60年代没で比較的現代に近い作家だし……

148:無名草子さん
23/01/21 23:22:50.23 .net
江戸川乱歩は初期作品だけ好き


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch