22/11/03 21:29:18.07 .net
>>599
喩えはよくわからないが、つまりやらなくていい自己満足だという意味だよね。
最終的には目視が絶対重要というところさえ揺るがなければ、
やってる人がメリット(誤字脱字検出)を得ている以上、
やらない人が全否定することでもないと思うよ。
みんなでやりやすいように、やろう!
603:無名草子さん
22/11/03 21:47:26.84 .net
皮をむいただけでは織田氏の浸みた美味しい大根になる道のりはまだまだ遠い田楽狭間よ
604:583
22/11/03 21:52:42.81 .net
さいごに
みなさんどうもご意見ありがとう
いろんな意見聞けて良かった!
だけどもし私の書き込みきっかけで
傷ついたり不愉快になったりした人がいたらごめんなさい
入力も校正もがんばります。
605:無名草子さん
22/11/03 21:55:37.73 .net
>>603
織田氏っていうtypoがいかにも工作員ぽくてすき
606:無名草子さん
22/11/03 22:02:41.01 .net
今更だけど、上の流れ、
前提の誤解で話が食い違ってるんじゃない?
質問者は「入力者からもらったテキストを校正者として校正する」作業のことを言ってるが
回答者の何人か(?)は
「自分が入力者として入力したテキストを、入力者校正する」作業のことと考えてない?
そう考えると
「心血注いで~」の意味や大根の例えが解る
607:無名草子さん
22/11/03 22:08:28.59 .net
質問者などいない説
608:無名草子さん
22/11/03 22:39:23.24 .net
第三者から見てると不快に思えるレスする人が何人かいる
609:無名草子さん
22/11/03 22:50:13.63 .net
ごめん不快にさせたのなら
>>600は自分
悪気はなかったんだが
そぐわなく感じてぶっきらぼうになってしまった申し訳ない
でも感じた理由が前提の食い違いだと解ったいまは、喩えの意味もわかるが
なんにしてもすまなかった
610:無名草子さん
22/11/04 01:06:45.73 .net
手入力したファイルとOCRのファイルなら、手入力したファイルのほうがはるかに信頼できる。
OCRをべた褒めするのは初心者のダニングクルーガー効果だから、適当にからかっとけばいい。
611:無名草子さん
22/11/04 03:34:34.57 .net
長編の入力だとocrがあるといざ作業に取り掛かる心理的ハードルが低くなる
612:無名草子さん
22/11/04 08:33:01.27 .net
>>611
なんとなくわかる
OCRの出力テキストがお粗末だと、人間さまの出番なので俄然やる気が出る効果があるし、
OCRの出力テキストが立派だと、苦しい作業から解放されてやる気が出る効果がある
613:無名草子さん
22/11/04 18:07:55.55 .net
>>612
どっちに転んでもやる気が出てて草
えらい
614:無名草子さん
22/11/04 18:49:17.14 .net
OCR出力テキストを起点にすると、クロスワードパズルとか倉庫番とかテトリスやってるようなゲーム感を楽しめるよ
615:無名草子さん
22/11/04 19:05:26.69 .net
OCRの吐き出したひどいテキストを綺麗にせずにいられない心理効果があるので、パズル好きとか掃除好きな人はOCRと相性良いと思う
616:無名草子さん
22/11/04 19:40:19.10 .net
それはちょっと分かるかも
617:無名草子さん
22/11/04 20:16:35.98 .net
ペンシルパズル好き自分、校正好きな理由をここにて知る
618:無名草子さん
22/11/05 11:42:59.20 .net
サイゼリヤの間違い探しvs青空文庫の校正作業
619:青空文庫アクセスランキング
22/11/05 15:26:07.18 .net
2022年10月
XHTML版
URLリンク(www.aozora.gr.jp)
テキスト版
URLリンク(www.aozora.gr.jp)
620:無名草子さん
22/11/06 00:08:17.88 .net
来月は走れメロスが爆上がりだろうな
>>569のおかげで
621:無名草子さん
22/11/06 14:40:27.09 .net
ここ一二週間体調がすぐれなくて
PCの前にあまり座れないでいる
そのために校正が滞ってしまい
なんとかならないのか……
と悩んでる自分にビックリした
本来紙と紙と突き合わせるのが校正の原点なんだから
修正はともかく
チェック作業にはPC要らんやん
スキャン画像を必要に応じて拡大したりしながら作業するのが当然になってて
PCないとできないと思い込んでる自分に草
622:無名草子さん
22/11/06 14:41:07.94 .net
思考が機械に依存してそう、自分
623:無名草子さん
22/11/06 14:55:36.73 .net
それ以前に思考が活字に依存してるから安心しなよ
手書き文書の崩し文字の読みづらさに耐えて文字起こした先人に感謝しないと
624:無名草子さん
22/11/06 15:04:39.23 .net
ほんとだね
先人すごいよ
625:無名草子さん
22/11/06 19:43:03.43 .net
とは言っても、当時の手書き文字は当時の人からすれば書き手の癖はあっても概ね第三者も読める程度に一般認知されてた(草書体のように法則に従って崩されてた)文字だったわけで、
さらに和文タイプライターは大正時代からあったと言っても日本語ワープロが普及する昭和50年代までは日常生活では基本的に手書きだっただろうし、
まだ忍耐というレベルの労力が割かれる程に時代の断絶はなかったんじゃないかな
626:無名草子さん
22/11/06 20:26:32.11 .net
文豪の手書き生原稿みるとなかなかにエグいもんな
あれを活字に起こしていくのが当たり前のようにできてた先人
俺たちが退化しているのか
627:無名草子さん
22/11/06 20:46:31.98 .net
それ以上、原稿の手書きセリフ「ひでえ」を誤読して「ひでぶ」と文字起こしして新ワードが生まれたマンガ『北斗の拳』をディスらないで
628:無名草子さん
22/11/06 20:47:24.59 .net
戦前は義務教育だって旧字旧仮名がデフォルトだったしな
629:無名草子さん
22/11/06 20:49:52.24 .net
まぁ校訂という作業が存在する程度には手書き文字の読み間違いや書き間違いも存在するけどね
630:無名草子さん
22/11/06 21:12:14.72 .net
文豪の手書き原稿とかみてもクセが強くって何書いてか分かんなくって
かつての編集者とか作家を缶詰めにしてとにかく書かせてその後
解読作業してなんとか雑誌掲載に間に合わせてたのかって思うと
ものすごく大変そう
ひと癖ある坂口安吾の担当にされた半藤一利の苦労とか
想像すると忍びない
631:無名草子さん
22/11/06 23:35:05.21 .net
遺稿集とかだと稀に直筆原稿の写真が載ってたりするけど7~8割しか読めない
残りの半分は推測の域を出ないもの、もう半分はマジで何か分からないもの
あとお偉いさんに序文を書いてもらって恐らくお偉いさん故にそのまま直筆で載せられてることもあるけど楷書以外は本当に分からん
632:無名草子さん
22/11/06 23:38:37.52 .net
スレチだけど江戸時代のテキストを翻刻してるみん翻の人たちのことは同じ電子テキスト化ボランティアとして応援してるな
633:無名草子さん
22/11/07 14:48:33.53 .net
ちょっと時間できた
がんばってくる
634:aozorablog
22/11/07 21:29:03.62 .net
青空文庫’22/09月-’22/10月の月間アクセス増率分析
URLリンク(www.aozora.gr.jp)
635:無名草子さん
22/11/08 21:27:12.89 .net
>>627
くお~!!ぶつかる~!!ここでアクセル全開、インド人を右に!
636:無名草子さん
22/11/09 16:38:02.96 .net
>>635
これすこ
637:無名草子さん
22/11/09 23:37:05.11 .net
みんな頑張れ
638:無名草子さん
22/11/10 12:13:21.65 .net
[第1話]漫古☆知新-バカでもわかる古典文学- - 漫☆画太郎 | 少年ジャンプ+
URLリンク(shonenjumpplus.com)
図書カード:蟹工船 (小林 多喜二)
URLリンク(www.aozora.gr.jp)
639:無名草子さん
22/11/10 14:45:11.43 .net
漫☆画太郎に普通を期待したアタシがバカでした
640:無名草子さん
22/11/10 20:27:54.48 .net
淡々と書かれてる解説が面白い
641:無名草子さん
22/11/11 11:01:12.01 .net
こんな投げ捨て漫画をいつまでもネタにする程度の低さに嘆く
642:無名草子さん
22/11/11 12:13:25.74 .net
早押しクイズで「オイジゴ」と読まれたら「蟹工船」と答える
643:無名草子さん
22/11/11 19:55:57.12 .net
じゃあ青空文庫冒頭4文字超イントロ
ここならわかる人いそう
「ではみな
石炭をば
ある日の
えたいの
私は、その
吾輩は
隴西の李
「こいさん
644:無名草子さん
22/11/11 21:55:43.21 .net
>>643
銀河鉄道の夜
舞姫
蜘蛛の糸
檸檬
人間失格
吾輩は猫である
山月記
細雪
で、あってるかな?
(人間失格と細雪は最初わからなかった)
645:無名草子さん
22/11/11 21:56:17.52 .net
割と一言だけでも続きを思い出せるな
646:無名草子さん
22/11/11 23:48:50.92 .net
「ある日の」
曲れる者(アーサー・コナン・ドイル)
羅生門(芥川龍之介)
蜘蛛の糸(芥川龍之介)
芸術統制是非(辰野隆)
「私は、その」
人間失格(太宰治)
婦人の過去と将来の予期(小川未明)
647:無名草子さん
22/11/12 08:50:21.08 .net
>>644
正解です、やっぱりすごいな。
似た文の指摘もありがとう。そう言えば蜘蛛の糸もある日始まりで結構有名な書き出しですよね。
648:無名草子さん
22/11/12 13:55:48.50 .net
クイズネタはクイズスレ立ててやってくれ
こういうのされるの困る
649:無名草子さん
22/11/12 15:35:22.53 .net
ごめん、ちょっとした出来心で。
もうやらないよ。
650:無名草子さん
22/11/12 16:11:48.05 .net
一回クイズやって答えただけで
別スレたててそこでやれ とは
657こそどこぞいけばいいのでは?
651:無名草子さん
22/11/12 16:23:21.52 .net
他の話題と同時進行とかでもないしな
652:無名草子さん
22/11/12 18:30:13.26 .net
自治厨どこにでも湧く
653:無名草子さん
22/11/13 23:45:57.78 .net
どこぞの音ゲーで夢野久作の『ドグラ・マグラ』をイメージした新曲が公表されたらしくTwitterのトレンドにドグラ・マグラが載ってた
654:無名草子さん
22/11/15 19:22:57.78 .net
周りに「中高のときに電子辞書に入ってる青空文庫の本を読んでた」みたいな人が結構いて、やっぱ意義ある取り組みなんだなとしみじみした
655:無名草子さん
22/11/15 19:54:51.90 .net
授業中電子辞書でドグラ・マグラ読んで俺カッケーしてたわwダセェ
656:無名草子さん
22/11/15 20:00:29.65 .net
「趣味は青空文庫の入力ボランティアです」みたいなこと言うと割と好反応が返ってくる
たまに「卒論書く時に活用しました」みたいなのも文理問わずある
657:無名草子さん
22/11/15 20:12:45.15 .net
意義はあるのかもしれないけど、出版社は文庫本で稼ぐ機会を失っている。
古典名著で出版社が稼いだお金が新人を支えるのに役立ってたのかもしれないと思うと、複雑じゃね?
658:無名草子さん
22/11/15 20:18:08.62 .net
青空文庫入りするみたいな古典文学って出版社にとってお荷物だったんじゃない?
659:無名草子さん
22/11/15 20:30:59.51 .net
青空文庫で無料で読める作品でも有名漫画家が表紙を描いたり文豪なんちゃらとコラボすればコレクターズアイテムとして売れるからね
660:無名草子さん
22/11/15 20:44:25.44 .net
むしろ営利企業なんだからこそ現在や将来の作家の育成をメインにしろよと思う
そもそも古典作品の出版だって校訂、現代語訳、解題、編集、翻案(漫画化)、裁定制度の利用とかで青空文庫との差別化は十分可能だからな
661:無名草子さん
22/11/15 20:45:47.95 .net
コレクターズアイテムって価値は数百円程度でも所有していることに意味があるからな
662:無名草子さん
22/11/15 20:48:39.35 .net
テレビに出て名を馳せた芸能人がYouTuber始めたら「ファンは嬉しいかもしれないけど、テレビ局は彼(女)を番組に出演させて稼ぐ機会を失っている」ってなる?
663:無名草子さん
22/11/15 20:53:15.35 .net
小中学生が学校から水洗されて読む古典文学なら収入は手堅いだろう。ポケモンみたいな位置づけ?
664:無名草子さん
22/11/15 20:57:29.08 .net
「私たち、日本の漫画を愛しているんです」といいながら著作権者に無断で中国語訳をつけた海賊版をネット公開する中国伝統の焼畑文化と差別化してかないと
665:無名草子さん
22/11/15 21:15:30.56 .net
そもそも文庫化や復刊すらされてない作品も沢山あるよね
しばらくして、どっかの文庫から文学アンソロジーが出て読んでみたら、出典に青空文庫と書いてあるという……
666:無名草子さん
22/11/15 21:17:14.41 .net
なんにせよ著作権は切れているのだから「出版社が稼ぐはずのお金」というのも変な話
出版社が出すならせっかくなら解説や挿絵で付加価値をつけてほしいよね
667:無名草子さん
22/11/15 21:22:56.52 .net
>>666
恩恵を得ていたのは出版社だけじゃないよ、卸売業者や書店もだよ
それを既得権とみなして破壊するか、紙の本の文化として守るかは、個々人の価値観次第
668:無名草子さん
22/11/15 21:34:40.12 .net
印刷や輸送や在庫管理や店頭陳列まで視野に入れるなら古典作品の商業流通は現役の文筆家が割を喰うことになるよな
669:無名草子さん
22/11/15 21:40:15.47 .net
打倒アンパンマンみたいな?
670:無名草子さん
22/11/15 22:15:59.90 .net
>>666
正しくは著作者の収益じゃないかな
出版社は代理販売業だよね
現実は力関係から権力入れ替わってるにせよ
671:無名草子さん
22/11/15 22:18:01.79 .net
20年前ライトノベルが1200円!!?
はっゴミのような読み捨て小説で1000円超え!!!?
と驚いてたけど
今は普通の文庫本ですら800円台で更にファッ!!?
となってる
漫画とかも全部凄く値上がりしてるし
きがつきゃう物価全部値上がりで
6畳用エアコンが12万円とか信じられないよ
672:無名草子さん
22/11/15 22:31:52.03 .net
定価1円と印字された戦前の本が古本屋で数万円
673:無名草子さん
22/11/15 23:42:57.59 .net
紙の本は字が小さくていけねえ
歳は取りたくないのう
674:無名草子さん
22/11/16 09:05:57.54 .net
>>666
紙の本の場合著作者に支払われるのは価格の一割に過ぎない
残りの九割は出版社、印刷、製本、運輸、卸、小売などの利益に
675:無名草子さん
22/11/16 17:46:54.88 .net
来年1月から電子書籍の国会図書館納本が始まるから、青空文庫で手入力しなくちゃならない本の数は将来的には減りそうだな。まだ電子書籍化してない本も沢山あるけど。
676:無名草子さん
22/11/16 17:54:38.22 .net
そうなんだよな。
ほぼ同時に電子書籍になるのがデフォになっていくと
デジタル化という概念自体がこれからは希薄になっていく。
そんな時代の流れの中で青空文庫の将来を思うと少し寂しいときもあるが、
それでも一時代の役割を果たしていることには変わりないと思いたい。
677:無名草子さん
22/11/16 18:14:41.54 .net
まあでもこのペースだとあと百年かかっても昭和時代の書籍の青空文庫入り作業も終わらないだろうけどね
ああでもそのうちAIイラストみたいにocrのブレイクスルーが起きて人の手作業なしで組版再現までできるようになるのかな。
678:無名草子さん
22/11/16 18:34:17.70 .net
>>676
電子化されてない本はまだまだあるんやで~
679:無名草子さん
22/11/16 20:37:48.49 .net
青空文庫は「自由に使えるように一番単純な(互換性の高い)テキストファイル形式で電子化する」という役割もあるのでそこが全部機械任せに出来るかどうかで変わってくる気がするな
半世紀以上先の話だけど国立国会図書館って電子書籍の著作権が切れたらどう公開するんだろうか
680:無名草子さん
22/11/16 20:55:25.09 .net
青空文庫読書アプリとFirefox、頼むからルビ検索できるようにしてクレメンス
681:無名草子さん
22/11/16 21:00:31.10 .net
>>679
デジコレでネット公開だと思うで
682:無名草子さん
22/11/16 21:02:20.96 .net
URLリンク(www.ndl.go.jp)
電書納本の説明会があったみたい
リフロー版電書よりPDFのほうが収集優先度高めなのは意外だった
683:無名草子さん
22/11/16 21:02:30.26 .net
少し脱線してWebブラウザの話するとSafari、Chrome、Edgeはルビ検索できるんだがFirefoxはいまだにルビ検索できない
文学作品などはくせのあるルビがその作品の作風の重要な要素だったりするから
例をあげると「強敵」と書いて「とも」とルビふる『北斗の拳』みたいな高い文学性
684:無名草子さん
22/11/16 21:05:21.50 .net
>>681
そりゃそうだろうけどフォーマットはどうなるのかって話
685:無名草子さん
22/11/17 00:27:55.19 .net
活字ファンの季節になった
銀杏の落ち葉集めて書棚の落ち葉と交換する時期だわ
686:無名草子さん
22/11/18 12:37:04.31 .net
食欲の秋、スポーツの秋、入力の秋、校正の秋
687:無名草子さん
22/11/18 18:08:27.14 .net
一年中校正中
688:無名草子さん
22/11/20 12:28:23.43 .net
校正ファイルを普段使いとは別のテキストエディタに移し替えて作業したり、違うビューワーで見てみたりすると誤字発見率が上がる気がする
689:無名草子さん
22/11/20 13:01:42.84 .net
同じエディタでもフォント変えるだけで変わリそう
○と〇とか紛らわしいけどフォントによっては区別つく
690:無名草子さん
22/11/20 13:07:17.24 .net
リ
691:無名草子さん
22/11/20 18:08:42.65 .net
googleドライブのOCR
急に使いにくくなったような気がするのだけど
最近アップデートがあったのだろうか
今まではあたりまえに読み取れていた同じ底本がなぜか変なアウトプットに
同じ現象の人いる?
692:無名草子さん
22/11/20 23:00:02.75 .net
Twitterで「#青空文庫で一番好きな作品を教えて」というハッシュタグが生まれてる
693:無名草子さん
22/11/21 13:33:15.23 .net
一番は難しいな
694:無名草子さん
22/11/22 08:34:36.14 .net
かといって10番目に好きな作品と言われるともっと困る
読みたいときにそこにあるってのが青空文庫の良さじゃない?
695:無名草子さん
22/11/22 09:04:47.16 .net
選べないよ
優柔不断とかじゃなく
696:無名草子さん
22/11/22 14:12:30.17 .net
作家 なら選べるかな?
漱石
697:無名草子さん
22/11/24 01:58:23.29 .net
ハッシュタグでないけどTwitter繋がりということで。
Twitterで最近『青空文庫から抜粋するbot』っての見つけてフォローしてるけど、知らない作品を読むきっかけになっていい。
698:無名草子さん
22/11/25 02:18:01.66 .net
青空文庫等が詩集を除いて「単行本を一冊」単位ではなく短編なりの「文章を一冊」として収録してるのって単行本の編集著作権に配慮してのことかな
699:無名草子さん
22/11/25 04:09:24.08 .net
>>698
単行本の編集著作権と聞いて「ツェッペリン飛行船と黙想」を思い出した
ちなみに「ツェッペリン飛行船と黙想」は著者没後に出た未発表短編集
700:無名草子さん
22/11/25 07:50:21.89 .net
>>698
編集著作権については『青空文庫作業マニュアル』の「3.底本を選ぶ 2)出版社の許諾は必要か」で触れてる
青空文庫作業マニュアル【本という財産とどう向き合うか】
URLリンク(www.aozora.gr.jp)
701:無名草子さん
22/11/25 09:13:54.00 .net
>>698
分かりやすい記事貼っておく
作者以外に認められる著作権「編集著作権」のこと
URLリンク(book.mynavi.jp)
702:無名草子さん
22/11/25 20:02:41.26 .net
>>425
これまだ何の返事もないんだけど、やっぱ届いてないのかな?
ちなGmail
703:無名草子さん
22/11/25 23:47:35.85 .net
真実は点検さんに聞かないとなんとも
ちなみ私がgmailで7月に送ったある作品は届いていなかったらしく
その後gmailでないアドレスから送り直したよ。
同じく7月にgmailから送った他の作品はちゃんと届いていたんだけど。
gmailの不具合なのか点検作業が大変なのかこちらは判断がつかないから、青空文庫用のやり取りにgmail を使うこと自体をやめたな
704:無名草子さん
22/11/26 12:13:09.37 .net
システムから受け取り確認の自動返信をもらえるようになると安心なんだけど
705:無名草子さん
22/11/26 15:07:24.68 .net
申請メールが多すぎてスパムに埋もれてしまってるんだろうね、きっと
706:無名草子さん
22/11/27 13:24:55.01 .net
スパムに埋もれるとはつまりランチョンミートに埋もれるということか
なかなか羨ましい状況にも思える
707:無名草子さん
22/11/27 22:01:52.11 .net
最近校了のペースより作品公開のペースのほうが早そうなんだけど、ストックがゼロになったことって今まであるんかな
708:無名草子さん
22/11/27 22:36:45.22 .net
公開ペースを一定にする(毎日なにかしらが公開されるという魅力を持たせる)ためにストックするのは
なにか商業主義的駆け引きを感じて自分としてはあまり好ましく思っていない
そもそも毎日新作?を楽しみにしている層と
そんなこと関係なく必要に応じて検索して青空文庫に公開されてれば嬉しい!という層とでは
後者の方が多いんじゃないかって思うんだよね(個人の感想です)
誕生日や命日まで温存しておかなくたって
完成し次第公開してもらえたほうが
ボランティアも利用者もありがたいと思うのだけどな
709:無名草子さん
22/11/27 22:47:44.52 .net
むしろ定期(毎日)更新って公開するための締切を自ら課してるだけじゃないの
パブリックドメインをウェブ上で公開する仕組みも入力や校正のデータも独占・奪取してるわけでもないし
青空文庫での公開の作業を担ってるスタッフだって他の工作員と同様に飽くまでボランティアなんだから
究極的には1年間に1作品以下の頻度の公開でも文句言える立場の人って別に居ないわけで
710:無名草子さん
22/11/29 22:23:27.41 .net
公開日を誕生日や命日とかにするのは公平で良いと思う。
711:無名草子さん
22/11/30 20:13:07.98 .net
正月公開は何になるのかちょっと楽しみにしてる
712:2022年12月公開予定作品一覧
22/11/30 20:28:44.76 .net
2022-12-01 山本 周五郎『だんまり伝九』
2022-12-02 ホワイト フレッド・M『トリガーセンの妻 コーンウォール物語』
2022-12-03 池田 勇人『政府を拘束しない』※誕生日
2022-12-03 佐藤 春夫『「珊瑚集」解説』※「珊瑚集」著者は永井荷風
2022-12-03 永井 荷風『歓楽』※誕生日
2022-12-03 室生 犀星『〈我が愛する詩人の伝記〉(補遺)』※佐藤惣之助誕生日
2022-12-04 山本 周五郎『伝四郎兄妹』
2022-12-05 作者不詳『現代語訳 平家物語 12 第十二巻』
2022-12-06 時枝 誠記『文学教育と言語教育』※誕生日
2022-12-07 坂口 安吾『光を覆うものなし ―競輪不正事件―』※競輪不正事件の不起訴処分決定が報道される
2022-12-08 山本 周五郎『峠の手毬唄』
2022-12-09 夏目 漱石『三四郎』※命日
2022-12-10 大田 洋子『いまだ癒えぬ傷あと ―放射線火傷で右手をうしなつた木挽きの妻と河原にうつ伏せて死んでいた幼女に―』※命日
2022-12-11 山本 周五郎『初午試合討ち』
2022-12-12 中谷 宇吉郎『日本の将来』
2022-12-13 田山 花袋『晩秋の頃』※誕生日(旧暦)
2022-12-14 尾崎 士郎『生きている忠臣蔵 ―忠臣蔵は何故流行するか―』※忠臣蔵の日
2022-12-15 山本 周五郎『春いくたび』
713:2022年12月公開予定作品一覧
22/11/30 20:29:06.29 .net
2022-12-16 グリム兄弟『天国へいった仕立屋さん』※ヴィルヘルム・グリム(弟)命日
2022-12-17 山本 周五郎『梟谷物語』
2022-12-18 佐藤 春夫『愉快な教室』
2022-12-19 山本 周五郎『武道宵節句』
2022-12-20 小泉 八雲『お貞のはなし』※翻訳者(田部隆次)命日
2022-12-21 山本 周五郎『蒲生鶴千代』
2022-12-22 柳田 国男『私生児の方言』
2022-12-23 徳田 秋声『青い風』『閾』※誕生日(旧暦)
2022-12-24 ドストエフスキー フィヨードル・ミハイロヴィチ『クリスマスと結婚式 ―無名氏の手記より―』※クリスマスイブ
2022-12-25 矢内原 忠雄『イエス伝 マルコ伝による』※命日
2022-12-26 菊池 寛『たちあな姫』『世に出る前後』※誕生日
2022-12-27 山本 周五郎『半化け又平』
2022-12-28 作者不詳『現代語訳 平家物語 13 灌頂の巻』
2022-12-29 三木 露風『明治詩壇の回顧』※命日
2022-12-30 横光 利一『自慢山ほど』※命日
2022-12-31 寺田 寅彦『宇宙の二大星流』※命日
2022-12-31 中谷 宇吉郎『「寺田寅彦の追想」後書』
714:無名草子さん
22/11/30 20:48:32.46 .net
新年の挨拶とかお正月に関するエッセイとかを入力すると1月1日に公開されるかな?
715:無名草子さん
22/11/30 22:01:41.61 .net
尾崎士郎訳の平家物語は年内に全編公開か
716:無名草子さん
22/12/03 20:06:34.95 .net
山周率9/31
717:無名草子さん
22/12/03 21:12:58.55 .net
作家別校了作品の比率から妥当かどうか検討してみてよ
718:無名草子さん
22/12/03 22:38:10.19 .net
妥当じゃなかったとして別に問題ない
719:無名草子さん
22/12/03 23:30:12.99 .net
作業数多いがゆえに校了して結構経ってるのに公開されてない作品を見るとなんかこの「間」もったいねえなと思うこともあるからガンガン公開して言ってほしい
一時期同じ作家の公開が続いたって無限に作品があるわけじゃないからいずれなくんだしなる
720:無名草子さん
22/12/04 03:37:45.27 .net
ガンガン公開しろってガンガン公開準備しろってことになると思うけどそんな厚かましいこと言うほど何か貢献してんの?
721:無名草子さん
22/12/04 08:46:28.56 .net
少なくとも毎月毎月「山周ばかり」って文句いうよりはいいと思う
722:無名草子さん
22/12/04 11:15:21.78 .net
種類に文句言ってるか量に文句言ってるかという違いだけでどちらも人任せなのは結局同じ
ただし他人により重い負担と労力を課そうとしているのは後者
723:無名草子さん
22/12/04 13:07:31.33 .net
>>715
一応14番目の解説もあるけどね
724:無名草子さん
22/12/04 13:15:21.77 .net
>>718
割合に応じて案分した結果の数字なのか意図的に配分してるような数字なのか出せって話であって、どっちを選んだら問題あるかないかなんて話はしてないでしょ
725:無名草子さん
22/12/04 13:25:29.36 .net
>>719
校了した翌日でも公開は可能な仕組みならともかく校了後ファイルも点検してるって言ってるし、その「間」とやらは作品ごとに差があるとしても公開に必要な期間なのでは?
726:無名草子さん
22/12/04 13:40:29.22 .net
いまいち分かってないんですが公開のタイミングって
そもそも誰が決めてるんでしょうか?
校正者の意向なんでしょうか?
誕生日目指して公開できるように頑張るとかの
モチベーションになってるってことであれば意味はあると思うのですが。
727:無名草子さん
22/12/04 14:13:43.59 .net
質問させてください
割り注に最大長とかみたいな制約ありますか?
728:無名草子さん
22/12/04 14:50:35.94 .net
>>724
いやだから、どっちか数字を出せ!って言われるような潜在的問題はなにもないから、出せって言うなという話でしょ。
729:無名草子さん
22/12/04 14:57:55.28 .net
>>727
ここで質問するより点検さんに訊くのが良いと思うよ。
点検さんの手を煩わせるのは申し訳ないと思ってここで訊くのだろうけど、
点検さんとしても訊いてくれたほうが後々の点検が楽になるわけだから、丁寧に質問に答えてくれるよ。
730:無名草子さん
22/12/04 15:06:44.26 .net
たしかに電子図書の割注の表示って
結局はユーザの表示する環境次第だから、複数行にわたる長い割注の場合どう表示されるんだろうね
我々の作業ではそこは意識するところではないんだけど
最大長の件、点検さんから答えがあったら、ここで共有してくれると嬉しいが
731:無名草子さん
22/12/04 15:13:54.09 .net
>>725
ですね。
公開用XHTMLファイルに変換する作業も人手も必要ですし
出来たXHTMLも公開用サーバに上げるからには表示チェック(校正ほどの厳しい目ではないにしろ通読する)必要もあるんじゃないかと思います。
732:無名草子さん
22/12/04 15:32:04.09 .net
あくまで提示されてる情報からの推測だけど、
注記一覧のページを見た限りだと、ルビ、縦中横、行右(左)小書き、上(下)付き小文字、罫囲み、横組み、文字サイズの注記については、
>対象文字が長めの場合や、外字注記が用いられているとき、前方参照型では期待通りに変換されない場合は、始まりと終わりを特定する開始/終了型で、次のように注記してください。
という旨の説明があって、2種類の注記方式を用意してるから、
【[#割り注]○○[#割り注終わり]】だけで【○○[#「○○」は割り注]】みたいな注記を用意していない以上は割り注の注記に文字数の制約はないんじゃないでしょうか
注記一覧 その他 - 青空文庫
URLリンク(aozora.gr.jp)
733:736
22/12/04 15:55:26.44 .net
まだ入力者登録してないので、点検の方に質問するのは後回しにします。
>>732
やはり制限はなさそうですね。
Windows用ビューワーであるPageOneやOyaziViewerでエラー発生するのは確認しているんですが、青空文庫と関係ない話なので厄介そうです
734:無名草子さん
22/12/04 22:29:29.61 .net
二段組に対応してるビューワーってあるんだろうか。
大して調べてるわけじゃないけど二段組は再現できない仕様が多いよね
735:無名草子さん
22/12/04 23:10:45.47 .net
>>726
作品の公開日については2020年01月01日のそらもようでちょっと触れてる
URLリンク(www.aozora.gr.jp)
736:無名草子さん
22/12/05 12:45:58.85 .net
>>735
記念日に公開したいって思惑は分かるんですがそれが校正者の意図なのか
公開者の一存なのかが知りたいです
737:無名草子さん
22/12/05 16:34:38.57 .net
>>736
校正者の意図か公開者の意図かという話になれば、それは概ね公開者の意図ということになると思う
ほとんどの作業ボランティアは点検グループの大変さや校正テキストファイルを提出してからその先の時間的長さと人的負担を理解していると思うので、いついつ公開してくれという希望は余程のことがなければ出さない(出せない)と思う
738:無名草子さん
22/12/05 19:51:55.02 .net
10校正したら1入稿というような何らかの制限つけたほういいと思う
そうしなきゃ自由気楽にきる入力ばかりやってしまう
739:無名草子さん
22/12/05 20:01:43.56 .net
発想面白いね
ただそこは作業者次第よ
だって自分は入力よりずっと校正してたいもん、達成感あるしね
だけど校正は点検グループの手を確実に煩わせるから
今は大量申請できないんだ
740:無名草子さん
22/12/05 21:38:35.42 .net
校正は自分の作業が確実に近い未来の公開につながるのが魅力よね
741:青空文庫アクセスランキング
22/12/05 22:48:09.82 .net
2022年11月
XHTML版
URLリンク(www.aozora.gr.jp)
テキスト版
URLリンク(www.aozora.gr.jp)
742:無名草子さん
22/12/06 09:28:56.97 .net
10校正したご褒美に1入力だと今の校正待ちが余ってる状態では成り立つけど最終的に校正待ちファイルが枯渇してさらに入力もできなるなるやで
743:無名草子さん
22/12/06 09:51:09.57 .net
だが待ってほしい
入力はOCRの仕事で、校正は人間の仕事になるのではないか
744:無名草子さん
22/12/06 11:40:11.36 .net
AI様が次世代デジタルライブラリーのocrと国会図書館デジタルコレクションの底本画像を組み合わせて、片っ端から自動で青空文庫注記をつけてくれた上で青空文庫のデータベース上に勝手に登録してくれて、あとは人が校正するだけになったら相当面白いかも
745:無名草子さん
22/12/06 11:56:22.82 .net
>>744
OCRの出力結果が正しいかどうか判断するAIが正しいかどうか判断するAIが正しいかどうか判断する人間のひと手間は避けられない
746:無名草子さん
22/12/06 16:30:09.95 .net
>>745
ワロタ
747:無名草子さん
22/12/06 18:07:23.19 .net
>>741
まさかの山川方夫短編が上位
おそるべしYouTube
748:無名草子さん
22/12/06 18:28:03.19 .net
>>747
YouTubeでなにかあったの?
749:無名草子さん
22/12/06 20:01:42.27 .net
>>748
YouTubeで、青空文庫の作品を要約してアニメにして紹介してる方が居て、おそらくその影響で上位になったと思われる
個人的に山川方夫さんは好きな作家だから嬉しい
750:無名草子さん
22/12/06 20:34:11.53 .net
なるほど、ありがとう
青空文庫をもとに制作しているYouTubeチャンネルも色々あるけど
それきっかけで青空文庫本家にユーザが来てくれるのは嬉しいね
751:無名草子さん
22/12/08 08:25:05.66 .net
[第2話]漫古☆知新-バカでも読める古典文学- - 漫☆画太郎 | 少年ジャンプ+
URLリンク(shonenjumpplus.com)
図書カード:にんじん (ルナール ジュール)
URLリンク(www.aozora.gr.jp)
752:無名草子さん
22/12/08 21:12:39.09 .net
また読んでしまった
753:無名草子さん
22/12/08 21:40:46.21 .net
文字通りオチが秀逸
754:無名草子さん
22/12/08 21:55:53.15 .net
解説の温度差よ
755:無名草子さん
22/12/08 23:37:32.37 .net
1話目でいつものパターンそのままでいらんと思ったので
今回はつられないぜ
756:無名草子さん
22/12/08 23:52:03.13 .net
教養が無いし翻訳作品はあまり読んでないから普通に知らんかった……
757:無名草子さん
22/12/11 11:58:41.29 .net
子どもの頃「少年少女世界の名作文学」で「にんじん」を読んで、これは何を伝えたいんだろうと真剣に悩んだ
758:無名草子さん
22/12/12 00:57:59.07 .net
あーおーぞーらーうーんーこー
759:無名草子さん
22/12/12 19:50:19.76 .net
みんな、今年の工作員ライフはどうだった?
760:無名草子さん
22/12/12 20:09:45.32 .net
青空文庫読者なので工作員の悲喜こもごもを楽しく見させていただいております
761:無名草子さん
22/12/12 20:43:12.02 .net
ごめん今週活動してないんだ……
762:無名草子さん
22/12/12 21:02:00.00 .net
4~5年放置してるやつをどうにかしないと……
763:無名草子さん
22/12/12 22:59:38.94 .net
作業申請するタイミングを逃し続けた
764:aozorablog
22/12/12 23:29:35.92 .net
青空文庫’22/10月-’22/11月の月間アクセス増率分析
URLリンク(www.aozora.gr.jp)
765:無名草子さん
22/12/13 06:59:19.63 .net
「JIS X 0213にはないがUnicodeにある漢字」を左ルビに使えるかどうかはビューワーの実装次第?
766:774
22/12/13 07:17:10.22 .net
Windows用アプリの左ルビ対応状況を調べてみた
[アプリ名(バージョン)] [JIS X 0213に規定された第3第4水準にある漢字] [JIS X 0213にないがUnicodeにある漢字]
えあ草紙(ver1.3.0) OK OK
PageOne(ver4.00) OK NG
OyaziViewer(ver2.6.5.0) NG NG
767:774
22/12/13 11:17:35.42 .net
PageOneはU+1F130からU+1F189までの四角囲みアルファベットを表示できないっぽい
768:無名草子さん
22/12/13 15:02:34.25 .net
そらもようにあった25周年記念のイベント?ってまだ期待してでもいいのかな
769:無名草子さん
22/12/15 08:55:50.81 .net
UTF-8に移行すれば、難しい字句のWeb検索で青空文庫のhtmlファイルがヒットする確率があがるんだが
770:無名草子さん
22/12/15 09:06:48.29 .net
だからずっとutf-8に移行して欲しいってずっと言ってきてる訳ですが
逆にsjisにこだわってる理由があるなら教えて下さい
771:無名草子さん
22/12/15 09:18:08.46 .net
中途半端に漢字をJIS X 0213の異体字に置き換える行為って、善意のようにみえて実は作品を蹂躙してるのと同じなんだよなあ
怖いよ、善意の破壊者
772:無名草子さん
22/12/15 09:30:25.20 .net
>>771
萩原朔太郎が「ローマ字論者への質疑」で
蝶は「てふ」でなくしてはならないなんていってるけど
現在の日本で蝶と「てふ」として読む日本人が果たして何人いるのか?
言葉は時代とともに移り変わっていくものであり
より良いものが提示されてるのに、検討もされないで思考停止してるのは
残念としか思えない。
773:無名草子さん
22/12/15 09:38:55.13 .net
そもそも今のコメントで引っ張ってくる漢字がutf-8の文字なら
そこにひと手間かける意味は何なんでしょうかと小一時間問いただしたい
774:無名草子さん
22/12/15 09:39:55.43 .net
>>772
それだと、底本がどんな表現を使っていたかを知りたい、流行の変遷を知りたい、っていう需要に答えられないんだよね
電子化テキストのほうで勝手に情報を捨てたら、復元できないわけで
775:無名草子さん
22/12/15 09:41:42.08 .net
「言葉は時代とともに移り変わっていく」のなら、なおのこと勝手にその時代の情報を捨てたらダメでしょ
著作権が切れてるのを良いことに踏みにじりまくってるね
怖いよ、善意の破壊者
776:無名草子さん
22/12/15 09:46:22.75 .net
なまじ外字フォントやら注記で置き換えられているのは、がんばれば元のデータを復元できる
問題は、勝手にJIS X 0213に収まる異体字に置き換えてしまうケース
復元できないんだから、文化大革命も同然だよ
777:無名草子さん
22/12/15 09:55:29.39 .net
スペインでキリストのフレスコ画をムンクのような絵に変えた事件あったじゃん?もう10年経ってたね
世界中で話題になった「おばあちゃんによる最悪の芸術品修復」から10年、町とおばあちゃんに起こった変化とは? - GIGAZINE
URLリンク(gigazine.net)
778:無名草子さん
22/12/15 09:59:14.96 .net
さて思考停止しているのはどっちかな
779:無名草子さん
22/12/15 10:22:13.21 .net
「諭」(「言+兪」, U+2F9D0)はわりとよく見かけると思うんだが、包摂適用で「諭」にしていいか議論の余地がある。
ちなみにWindows環境だと、Meiryo UIフォントとか使わないと「諭」(「言+兪」, U+2F9D0)は表示できないので不便。
780:無名草子さん
22/12/15 10:29:38.40 .net
これと萩原朔太郎の言をを一緒にするのは流石におかしい。
その時代の異字体を大切にしたいなら、その方向での注釈をつけるべきで
utf-8の字体を全面的に拒む理由にはならない。
今後も機会あるごとに青空文庫のユニコード化は訴えっていこうと思います。
781:無名草子さん
22/12/15 10:46:40.91 .net
共産主義者が多いのかな、青空文庫の利用者って
賢いフリするのが好きなだけで頭悪そうな感じ
782:無名草子さん
22/12/15 10:49:00.00 .net
Google先生に拾ってもらえなくなったらおしまいだよ
783:無名草子さん
22/12/15 10:49:52.06 .net
頭悪いは否定しませんが頭悪くっちゃ青空文庫利用しちゃいけないんですか?
というかワッチョイつけて欲しい
784:無名草子さん
22/12/15 11:04:49.43 .net
>>769 以降の書き込みは、>>770,772,773,780,783 以外全部同じ人だよ
書いた本人が言うんだから間違いない
外字フォントや注記のままだと、いつまでたってもGoogle先生を始めとするWeb検索エンジンに拾ってもらえない。
Unicode化をぜひやってもらいたい。
785:無名草子さん
22/12/15 11:36:23.23 .net
>>770,772,773,780,783 は全部自分なんで、結局二人で言い合ってたわけかorz
この話題は広く議論してもらって、できるならutf-8化の方向で前に進めてもらいたいです。
786:無名草子さん
22/12/15 12:02:59.56 .net
突然始まって唐突に終わった気がする
とにかく何が言いたいかというと屁のツッパリはいらんですよ
787:無名草子さん
22/12/15 12:30:53.15 .net
普通に名前欄使えばいいのに
788:796
22/12/15 12:36:25.66 .net
仮名遣いはともかく、漢字に関しては出版社や印刷所や編集者の都合なり意向なりでいくらでも変わるし変えざるを得ないので異体字の包括表記はそこまで重要ではないと思う
それでもなお必要と思うなら「自分でやれば?」って感じ
自分でサイト作らなくてもWikisourceとかがあるしね
789:無名草子さん
22/12/15 12:53:07.17 .net
包摂適用についてはまあその通りで実用に問題ないレベルだと思う
じゃないと今まで放置されてない
790:無名草子さん
22/12/15 17:06:07.13 .net
正直自分はUTF-8に対応してくれたほうが嬉しいけど
そもそも現状の青空文庫一強みたいな風潮も変だし、違うアーカイブがもっと増えてもいいんだよねぇ
自分も青空文庫用に作った作品ファイルを自サイトで公開してるけど、その時は極力字を底本通りに直してるわ
791:無名草子さん
22/12/15 17:11:03.93 .net
単に電子テキストをアーカイブ化したいって言うなら、青空文庫で入力校正の手続きを踏むより
電子テキストをepub形式にしてKDPやkoboで出版→国会図書館の電子書籍納本、とかのが一人で完結するし手っ取り早いかもしれない
792:無名草子さん
22/12/15 17:40:59.57 .net
青空文庫は今のSJIS仕様のままだと、鬼門・地雷原ともいうべき旧字の多い作品の入力校正を皆が避けるようになってしまうから、良くないんじゃないかな
793:無名草子さん
22/12/15 22:43:06.96 .net
字形や表記にこだわる人は編集行為を嫌悪していると思う。
しかし編集があるから本になるし青空文庫にも載る。
包摂適用も編集行為のうちで、問題があるとは思わない。
794:無名草子さん
22/12/15 22:58:32.39 .net
本当にこの件を議論したい(動かしたい)ならば
ここより、そらもようでコメントしたほうが現実的かもね。
別にここではその話するなって意味じゃないよ。
いろんな考え方聞けて面白い
795:無名草子さん
22/12/15 23:15:37.47 .net
極稀に直筆原稿複写版の本あるよね
796:無名草子さん
22/12/15 23:44:46.92 .net
包摂適用はやむを得ずそうしてるだけで
青空文庫の基本的なスタンスは底本の尊重にあると思ってるから
SJISよりUTF-8のほうがそのスタンスにかなうならそうした方がいいとは思う
でも結局UTF-8にしたところですべての漢字が表示できるわけではないから、どこかで妥協する必要があるのは同じなのよね
運営も割と長年このことは議論してるんじゃなかったっけ
今のところSJISで行くんだろうけど、そのうちUTF-8対応になっても驚きはしないかな
797:無名草子さん
22/12/15 23:56:12.80 .net
青空文庫とShift_JISとUnicodeの関係については前スレでもちょっと話してたね
スレリンク(books板:778番)
スレリンク(books板:779番)
798:無名草子さん
22/12/16 00:07:35.72 .net
URLリンク(forest.watch.impress.co.jp)
「質疑応答では、青空文庫のデータにはシフトJISコードが用いられているため、海外の方がファイルを開くと文字化けしてしまうなどの問題が指摘された。Unicodeを採用すると、旧字をどうするか? などのルール変更が必要なので、これからの青空文庫の課題として考えていきますという回答がなされた。」
2017年の講演でこういう話は出てるから、運営もSJISのままでいることが最善最適とは思っていないとは思う。だからって将来的に変わるかどうかまではわからないけど。
799:無名草子さん
22/12/16 06:23:38.82 .net
>>793
誰も編集を嫌悪してなどいない
工作員が無難に編集できる作品しか選べない現状の仕様が問題なんだよ
熟練の工作員ほど無意識のうちに避ける習慣ができてしまっている
800:無名草子さん
22/12/16 06:40:18.78 .net
底本のある文字を青空文庫で利用可能な異体字に変えた場合は、変えたことを認識できる仕組みがないと、情報を捨てる破壊行為に貢献する皮肉な結果になる
たとえそれが善意だったとしても
801:無名草子さん
22/12/16 07:00:36.70 .net
モリカケ問題からもわかるように、改ざんしたことではなく改ざん履歴が失われることが問題の本質
802:794
22/12/16 08:58:58.18 .net
>>794
そらもようにコメントつけられるんですか?
青空文庫の将来について一番活発かつオープンに議論できる場って
ここだって思ってるんですが他にもアプローチの仕方があるなら
教えて欲しいです
803:無名草子さん
22/12/17 13:57:35.88 .net
包摂適用による字の改変が問題なら今まで包摂適用してた字も外字扱いにして注記でなんとかすれば文字コードのシステム変えなくても対応はできるな(工作員の作業量は増える)
804:無名草子さん
22/12/17 17:47:57.67 .net
そこまで厳格にしていくと「そもそも(複数ある場合に)その底本の選別は正しいのか」という問題にまで発展していく
少なくとも現時点で青空文庫に収録されてる作家のほとんどは直筆原稿がオリジナルであって、初出誌の時点で多かれ少なかれ出版用に改変されたものでしょ
それで活字状態のオリジナルとして初出誌に限定しようとしても誤植のリスクがあるし全ての作品で直筆原稿まで直接確認できるとは限らない
805:無名草子さん
22/12/19 12:41:23.39 .net
話題に上がりさえしない変体仮名
806:無名草子さん
22/12/19 12:46:43.46 .net
尾崎紅葉 鬼桃太郎
807:無名草子さん
22/12/21 17:42:59.41 .net
>>805
話題にすればいいじゃない
ついでなので関連質問させてください
青空文庫・外字注記辞書【第八版】にある、合字の「シテ(U+2CF00)」は、本来は「〆(U+3006)」とは別のものらしいんだけど、青空文庫では同じ?
808:無名草子さん
22/12/21 19:40:33.38 .net
確かに外字注記辞書では
※[#シテ]〆 入力可能
となってるけど
ウィキペディアでは混同されてるけど別物と説明されてるな
して - Wikipedia
URLリンク(ja.wikipedia.org)
809:無名草子さん
22/12/21 19:52:47.49 .net
※「シテ」「トモ」の合字は、仮名にあらためました。
図書カード:蟻説 (高木 貞治)
URLリンク(www.aozora.gr.jp)
※「シテ」の合字は、仮名にあらためました。
図書カード:北越雪譜 (鈴木 牧之 山東 京山)
URLリンク(www.aozora.gr.jp)
合字を仮名に改めるパターンが少ないから〆で代用してるのかね
代用というか誤字だろうけど
810:無名草子さん
22/12/22 12:54:41.67 .net
2023年1月1日に1927年以降の著作物がアメリカのパブリックドメインに、「シャーロック・ホームズ」短編集・映画「メトロポリス」・ヒッチコック作品などなど - GIGAZINE
URLリンク(gigazine.net)
Public Domain Day 2023 | Duke University School of Law
URLリンク(web.law.duke.edu)
811:そらもよう
22/12/23 07:38:46.52 .net
2022年12月23日 青空文庫の新サーバーおよび新システムの導入に際しての充電期間の設定について
URLリンク(www.aozora.gr.jp)
812:無名草子さん
22/12/23 10:38:23.94 .net
入力申請は今年中に、ということかな
813:無名草子さん
22/12/23 12:30:33.73 .net
いやもう送るなよ
814:無名草子さん
22/12/23 13:06:41.82 .net
別にいいんじゃないの、来年の1月1日からだからまだ間に合う
ダメだったらダメって書くだろうし
815:無名草子さん
22/12/23 15:51:48.65 .net
1月1日から新プロジェクトに本腰入れたいって話だろうから、
今から受付作業が来年へずれ込む程の大量申請が押し寄せたら意味がないよ
816:無名草子さん
22/12/23 20:50:51.07 .net
>>811
わらった。
事業は休んだら終わり。このまま無くなるだろうに1ユーロ。
817:無名草子さん
22/12/23 21:13:50.45 .net
休んでないわけだが
818:無名草子さん
22/12/23 21:15:21.00 .net
>>814
ダメだったらダメって書く
じゃなくて
申請は年内にお早めにって書いてない
って解釈しなよそこは
819:無名草子さん
22/12/23 21:27:00.94 .net
新たな特務チームってどんなんだろうな。
したっぱ新入り工作員だからノウハウ教えてもらえるならありがたい
820:無名草子さん
22/12/23 21:28:38.48 .net
出す・・・・・・!出すが・・・・・・今回まだその時と場所の指定まではしていない
そのことをどうか諸君らも思い出していただきたい つまり・・・・
我々がその気になれば金の受け渡しは10年20年後ということも可能だろう・・・ということ・・・・!
821:無名草子さん
22/12/24 01:11:28.33 .net
運営が「通常の作業ペースが保てなくなっている」って訴えるほどだから
もう申請しないほうがいいんじゃないの
822:無名草子さん
22/12/24 01:47:55.36 .net
>>814
1月1日に言えば済むことをわざわざ1週間前に色々と事情を説明して通告してる時点で気付けよ
823:無名草子さん
22/12/24 02:13:21.27 .net
>>822
1月1日直前までは受け付けるってことだよ
824:無名草子さん
22/12/24 02:51:06.39 .net
受け付ける(1年間放置)
825:無名草子さん
22/12/24 03:18:01.92 .net
そらもようで告知を出す前に届いた申請やファイルの処理の途中で今年が終わるだろうから、1日で点検と公開準備が終わるような短編の校了作品が駆け込みで届けば来年の公開作品が増やせてラッキー、くらいの猶予期間でしょ
それこそ現状では対応が間に合わないとちゃんと言ってるし、12月31日までに全部対応するとは言ってないんだから、他は放置でも全く問題ない
826:無名草子さん
22/12/24 06:21:04.28 .net
入力申請は他の人と被らないようにする宣言みたいなもんだから、ひとりで長編作品とかやるつもりならちゃんと入力申請しとけばいいと思うよ
827:無名草子さん
22/12/24 13:06:04.92 .net
今年工作員になったんやけど今思えば滑り込みでいろんな作業やれたんやなと思う
休止期間の特務チームって教育係みたいなのがつくのかな。年明けの詳細が気になる
828:無名草子さん
22/12/24 13:06:13.13 .net
>>819
自分の知識のためだけで
組織のために働けない冷やかしならやめて欲しい
829:無名草子さん
22/12/24 13:29:48.34 .net
工作員やってる時点で「自分の知識のためだけ」ではないやろ
青空文庫のノウハウとか青空文庫以外では使おうにも使えないし
なんでかここもギスギスしてるね。急な発表だったからかな
830:無名草子さん
22/12/24 13:36:05.06 .net
特務チームのことを読んで最初に思ったのがそれなんだよ
受付点検グループへの門戸はずっと開かれていたんだよ、今までも
でも叩くものが(多分ほとんど)いなかった
それを特務チーム結成と聞いてガヤガヤと集まる人々にどれだけの熱意と継続力があるのか
鍛えるだけ鍛えたチームメンバーがある日突然なしのつぶてじゃ、組織のためにならない
滅私奉公で名前も知られず継続的に仕事をしている点検グループ
興味は持ったけど内容を聞いてやっぱり自分には無理です、とはっきり辞退するならいいが
頭数だけ増えて幽霊メンバーじゃ意味ないから
加わるならしっかり責任もって加わりたい
831:無名草子さん
22/12/24 13:36:37.87 .net
【3回目】 追加接種 =⇒ 死者増加 【4回目】
//kizuna.2ch.sc/test/read.cgi/hikky/1667019659/l50
URLリンク(o.5ch.net)
832:無名草子さん
22/12/24 13:38:31.87 .net
>>829
自分の作業のしやすさだけ
と置き換えると解ると思う
833:無名草子さん
22/12/24 13:42:31.60 .net
第一現役工作員自体がそんなに居ないんだからガヤガヤ集まるというほど集まりはしないだろう
そこまでの熱意ある人だけじゃ先細るから裾野を開くためにこういうことしてるんじゃないかと思ったけどな。
834:無名草子さん
22/12/24 13:45:12.97 .net
むしろただ門を開いてるだけじゃ入らないからこそ改めて宣伝してるんでしょ
835:無名草子さん
22/12/24 13:55:05.66 .net
ギスギスも何も、「もう手が回らないので来年から休みます」って年末になってようやくNOやSOSを言えるようになった人に対して「今年はまだ残ってるな」で相手に負担をかけようとするのは、単純にブラック企業顔負けの発想過ぎるし、それに対して批難する奴が出るのは自然の流れだと思う
836:無名草子さん
22/12/24 14:07:38.90 .net
それなオブそれな
837:無名草子さん
22/12/24 14:32:43.32 .net
好きにすりゃいいさ
そもそも金は絡まず名前が付くという名誉しかないんだ
838:無名草子さん
22/12/24 14:43:16.11 .net
点検さんはそれ(名前がつく名誉)すらないのにやってくれてるのに
839:無名草子さん
22/12/24 14:44:54.91 .net
金が絡まなきゃ好きに振る舞っていいわけじゃない
840:無名草子さん
22/12/24 14:49:15.02 .net
>>835
一個人が運営してるわけじゃないので、そんな配慮は無用だよ
なんか勝手に青空文庫の管理グループを一個人に人格化してる人いるみたいだけど、
むしろそういう人は自身の心の病気を疑ったほうがいい。自己投影なのかもしれんが
841:無名草子さん
22/12/24 14:52:00.41 .net
マナー奉行みたいな書き込みしてる人、心病んでるんじゃないの?マジで
842:無名草子さん
22/12/24 14:58:49.09 .net
>>839
常識はずれがタマにこうして現れるから
電子レンジでネコを乾燥させないでくださいとか取説に書く必要があるんだな
日本人でもこうした程度が低いやつが現れると困る
843:無名草子さん
22/12/24 15:01:14.13 .net
>>838
客観的に見て作業の大変さは点検の方だから連名したらと思うが
どの程度点検してるのかわからないから難しそう
自己申告系はほんま難しいな
844:無名草子さん
22/12/24 15:02:19.75 .net
好きに振る舞っているのはむしろ青空文庫のほうなんだが
なんか教祖を擁護するM信者みたいな書き込みしてる人、マジでヤバい
845:無名草子さん
22/12/24 15:04:14.59 .net
>>844
暖簾に腕押し見たいな何言ってるのかわからん
ある意味白昼夢みたいな主語置いてきぼりな言葉はこのスレに合いませんよ
846:無名草子さん
22/12/24 15:06:14.95 .net
未着手タスクの山になっても平然としていられるような手合いが青空文庫の中の人たちなんだが、
なんかこのスレに忖度要求を書き込む人は、自分が繊細だから青空文庫の中の人も繊細なはず、と勝手に思い込んでてキモイ
847:無名草子さん
22/12/24 15:31:06.11 .net
青空文庫の中の人たちを直接的に知ってて言ってるのかイメージで言ってるのかが気になるところ
848:無名草子さん
22/12/24 15:38:44.43 .net
>>846
平然としてると思ってるのか……
それこそ自分の面の皮が厚いから
中の人も厚いはずと思ってるのね
849:無名草子さん
22/12/24 15:47:23.15 .net
>>848
入力者への影響が大きい「充電期間の設定」の告知をわずか1週間前に行うくらいだから、中の人はメンタル強者そのものだよ
中の人だけじゃなく入力者もボランティアなわけで、それをわかったうえでやるのだから
850:無名草子さん
22/12/24 15:50:01.66 .net
まぁ一般工作員にとっては点検作業や点検グループって謎な部分は大きかったから
休止期間の施策として点検について教えてくれるならありがたい話だな
点検グループにとって何が迷惑で迷惑じゃないのかとかは想像するしかない部分も多いし
点検グループに回らない工作員にとっても、点検グループがどんなふうに作業を回してるのか分かれば気を遣いやすくなると思う
851:無名草子さん
22/12/24 15:51:48.88 .net
>>840
むしろ集団が分担してやってるのに全然間に合ってないんだから個人でやってるより問題は深刻だろ
852:無名草子さん
22/12/24 15:57:09.43 .net
>>851
いきなり倒産を発表する企業とかはまさにそんな感じだね
853:無名草子さん
22/12/24 16:00:08.00 .net
そもそも「大量申請は控える」って公式に明文化されていますし
無視するわけにいかんでしょ
854:無名草子さん
22/12/24 16:01:01.87 .net
正直年単位で参加しててここ半年くらいにも連絡を取った工作員なら何となく運営チームが限界を迎えてそうという察しはついてたよな
855:無名草子さん
22/12/24 16:09:17.33 .net
突如夜逃げして債権者に迷惑かける人を面の皮が厚いとみなすかどうかだね
夜逃げした本人は面の皮が厚いとは思っておらずむしろ、自己憐憫してたりする
856:無名草子さん
22/12/24 16:17:08.82 .net
そもそも青空文庫は紙の出版物と違ってWebなのだから公開しながら適宜修正していけるはずなんだよ
点検グループはなにを点検しているのか、という話にもなるわけで
857:無名草子さん
22/12/24 16:22:37.48 .net
テキストファイルの管理はGithubでしてPR受け付ければよくね?、みたいな話は出てこないもんなのかな
中の人の思考様式が、時代遅れになってないか?
858:無名草子さん
22/12/24 17:01:08.51 .net
>>856
「とりあえず公開して、間違いや不備に気付いた段階で適宜修正すればいい」という手法の妥当性や有効性はWikipedia見てたら何となくは分かると思うけど
859:無名草子さん
22/12/24 17:16:06.41 .net
>>858
Wikipediaは誰でも彼でも書き換えできてしまうので論外
修正を受理するか確認できるGithubのPR(Pull Request)機能を使えばそういった問題は起きない
時代遅れな人は時代遅れであることに気づけない
860:無名草子さん
22/12/24 17:21:16.03 .net
どこかでgithub自体がもはや時代遅れって見て
一時は真面目に学んでみようかなんて思ってた気持ちが
一気に萎んだんですが実際のところはどうなんでしょうか?
861:無名草子さん
22/12/24 17:25:42.33 .net
Githubを使えば、一般ユーザーは管理者ユーザーから修正内容を却下されてもめげずに独自に修正作業しつづけることができる
このプログラミング業界のソース管理技術を青空文庫が応用しない手はないよ
バックアップや履歴管理の負担はかなり減るからね
たぶん充電期間に、そういう話されるはず、と思いたい
862:無名草子さん
22/12/24 17:43:48.29 .net
>>860
Githubが時代遅れという情報源はどこでしょうか
いまやマイクロソフト社までもがGithub使っています
個人的には、有力な代替手段が見つからないうちはGithubは時代遅れではないと思いますよ
863:無名草子さん
22/12/24 17:47:58.58 .net
どなたもメリークリスマス
来年は吉報があるよ
864:無名草子さん
22/12/24 17:50:38.43 .net
>>856
点検グループは情報や権利の正当性も合わせてチェックしている
ただ底本にそったテキストを作るだけのわれわれとは作業の性質が違うのだからそんな風に言わないで欲しい
865:無名草子さん
22/12/24 18:07:45.21 .net
>>864
点検グループへの同情や忖度なんて一切必要ない
点検グループが作業を可視化しければ、無能な貴族呼ばわりされる。それだけ
866:無名草子さん
22/12/24 18:13:12.88 .net
>>859
それを公開前に前倒しで全文を対象として1回やってるのが今の「公開前に入力者と点検者以外による校正作業を入れる」という手法だよね
それでも漏れがあるから誤植があったら底本の画像付きで連絡くれって言ってるんだし
867:無名草子さん
22/12/24 18:44:43.17 .net
>>865
点検作業で何をしているかについては既に可視化されてるけどね
相手が情報を公開しても確認しない調べもしない人は何て呼ばれるのかな?
青空文庫はこうやって運営され、こうやって活用されてます - 鷹野凌のデジタル出版最前線 - 窓の杜
URLリンク(forest.watch.impress.co.jp)
青空文庫20周年記念シンポジウム「青空文庫の今とこれから」:チュートリアルセッション 青空文庫の仕組みとボランティア入門 - YouTube
URLリンク(www.youtube.com)
青空文庫20周年記念シンポジウム「青空文庫の今とこれから」
URLリンク(www.aozora.gr.jp)
868:無名草子さん
22/12/24 18:52:18.97 .net
>>867
言葉遊びしたいの?
スローガンを見せることが可視化ではないよ
日々の点検の進捗を可視化しなければ意味がないでしょ
869:無名草子さん
22/12/24 18:56:18.53 .net
>>868
こっちの話?
青空文庫の作業状況
URLリンク(yozora.main.jp)
870:無名草子さん
22/12/24 19:49:20.25 .net
言うほどスローガンか?
871:無名草子さん
22/12/24 19:49:43.59 .net
アプリ開発できるような人が参加してくれると良いな
それか
青空文庫アプリ会社に向けて文字ミス通報機能追加してもらうとか
こういうのを読者にも頼めればずいぶん楽になると思う
872:無名草子さん
22/12/24 19:50:25.73 .net
ミス
青空文庫アプリ会社 → 青空文庫対応アプリ開発者
873:無名草子さん
22/12/24 20:17:07.54 .net
>>862
github でググった時に検索候補に危険性って出てきて
記事を読んでる中にそのようなことが書かれてたんです
便利そうで覚えたいと思っていたのですが
874:無名草子さん
22/12/24 21:14:52.54 .net
>>869
「入力予約」の状態ってどうなってんの?
入力予約 : 3件
2008年:1件
2003年:1件
2002年:1件
875:無名草子さん
22/12/24 21:42:14.76 .net
そうなってるんだよ
876:無名草子さん
22/12/24 21:46:58.74 .net
>>852
状況としてはこれに近いと思う
厳密に言うと青空文庫は本の未来基金とかもあって経済的には一応余裕があるけど運営の人手が圧倒的に足りないというのが根本的な問題だから倒産(≒サイト閉鎖)の危機はないんだが
877:無名草子さん
22/12/24 21:47:04.84 .net
校了後が長すぎる作品についてはどういう理由があるのか疑問視する意味はあるが
ほかのステイタス、それも著作権切れ延長に係るような作家作品でもないのなら、想像するだけ無駄
878:無名草子さん
22/12/24 21:53:10.78 .net
少なくとも2010年以前に校了状態になってる作品は公開前までに共著者や戦時加算の都合で著作権法保護期間中と判明されてるものだよ
それ以降は公開準備中のものと法改正で保護期間延長になったものが入り交じってる
879:無名草子さん
22/12/24 21:58:41.09 .net
>>878
だったよね。
ほかのステイタスについては個人か運営の都合としか言えない。
誰かが代打を申し出ることはできるし、長期放置が気になるなら代わってあげてもいいんじゃ?
二十年も前となると可能性としては本人さんが存命かどうかも疑わしい。
青空文庫の歴史が長くなればこれからこういうことは増えていくと思う。
880:無名草子さん
22/12/24 22:09:42.59 .net
冗談じゃなくてNPO法人化した方が良いともう
881:無名草子さん
22/12/24 22:36:33.00 .net
とりあえずマナー奉行と忖度強要奉行は全員氏んでくれ
882:無名草子さん
22/12/24 22:39:47.34 .net
>>881
とっくに引っ込んでるものを蒸し返すな
883:無名草子さん
22/12/24 22:58:33.72 .net
忖度したら死ぬのか
忖度に親を殺されたのか
ってくらいの憤怒
884:無名草子さん
22/12/24 23:13:18.68 .net
来年の公開頻度は毎週日曜日くらいになるのかな
885:無名草子さん
22/12/24 23:20:13.77 .net
お正月特別公開とかあんのかな
886:無名草子さん
22/12/24 23:43:11.07 .net
入力予約は昔の制度っぽいけどサイト内検索してもいまいち分からんな
887:無名草子さん
22/12/25 00:18:57.77 .net
質問です
なり、ナリの仮名、青空文庫・外字注記辞書(大八版)には見当たらないようなのですが、ご存じの方いませんか?
なり (仮名) - Wikipedia
URLリンク(ja.wikipedia.org)(%E4%BB%AE%E5%90%8D)
888:896
22/12/25 00:20:50.03 .net
URLが間違っていたみたいなので張り直し
なり (仮名) - Wikipedia
URLリンク(ja.wikipedia.org)
889:無名草子さん
22/12/25 00:35:31.22 .net
>>887
• 「コト」「より」以外の合字は現代平仮名、カタカナで入力して、ファイル末に下記のように注記してください。
※「シテ」「トモ」「トキ」「こと」「ごと」「まいらせそうろう」の合字は、仮名にあらためました。
• 仮名に書き換えるのではなく、外字注記したい合字は下記を参考にたとえば「※[#シテ、ページ数-行数]」のように本文中に注記してください。
……と外字注記辞書に書いてあるからそれに準ずる
890:896
22/12/25 00:53:21.16 .net
>>889
回答、ありがとうございます
891:無名草子さん
22/12/25 00:59:41.88 .net
外字注記辞書の更新も点検グループの仕事のひとつ。
892:無名草子さん
22/12/25 01:24:24.33 .net
最新の外字注記辞書は第8版か
893:無名草子さん
22/12/25 14:06:26.08 .net
Unicodeへの移行とかも行われるのかね
894:無名草子さん
22/12/25 14:20:22.00 .net
かもね
積年の課題をやっつけるためにはいい機会だ
なにかできることがあったら加わりたい
895:無名草子さん
22/12/25 14:37:38.07 .net
入力中→校正待ち
校正中→校了
この間に、「点検はしていないが受領はした」というモードが欲しいなあ
「校正待ち(点検前)」というモードもあるけれど、これはほとんど機能していなくて
入力者自身が中の人の場合くらいしか使われてないんじゃないかな
耕作員としては自分の手を一旦離れたものなのに
ずっと自分のところで○○中のまま停滞しているように見えるのこそ悲しけれ
896:無名草子さん
22/12/25 18:01:40.00 .net
今はJIS X 0213以外の漢字を含む青空文庫の作品内キーワードはWeb上に存在しないも同然の扱いになってる
Unicode対応するとJIS X 0213以外の漢字を含む作品内キーワードの多くをGoogleなどの検索エンジンが認識できるようになる
897:無名草子さん
22/12/25 18:14:29.25 .net
Googleを引き合いに出してUnicodeを化が必要という話がたまに出るけど
むしろGoogleのほうが青空文庫形式に対応すべきじゃないの
と思う
898:無名草子さん
22/12/25 18:20:01.95 .net
>>897
それやると、かえって逆に青空文庫側が自由に仕様変更できなくなるよ
青空文庫がhtml外字の仕様変更するたびに検索エンジンから見えなくなるからね
そういう二度手間なくすためのUnicodeってこと
899:無名草子さん
22/12/25 18:27:10.66 .net
青空文庫が出版業界と共存できる差別化は、せっかく紙で再版しても旧字旧仮名だらけで一般読者にはとっつきにくくて採算とれそうにない旧作の電子化だからUnicode対応待ったなしなんよ
900:無名草子さん
22/12/25 22:05:27.21 .net
>>802
今さら亀レスですが
そらもようじゃなくてaozorablogの間違いでした
すみません充電してきます
901:無名草子さん
22/12/25 23:20:37.34 .net
ママ注記にUnicode文字注記含んでるとつまりPageOneでエラー扱いになるからさっさとUnicode対応してほしい
902:aozorablog
22/12/26 20:41:32.07 .net
『するりと鏡を―ぬけてみて、アリスの目に見えたもの』第2章
URLリンク(www.aozora.gr.jp)
903:無名草子さん
22/12/26 21:36:13.63 .net
Unicodeとかもそうなんだけど作家・作品・底本(出版社や時代)を跨いだ全ての文章の一括検索という観点からすると
例えば「ほぼ」と「ほゞ」と「略」と「略々」と「略※[#二の字点、1-2-22]」みたいに表記揺れのある単語や言い回しをそれぞれの底本に準拠させる必要性がどこまであるのかみたいな問題にもなってくると思うんだよね
(他にも小書きかどうかだったり新字と旧字みたいな区別も出てくる)
それを検索サイトやシステム側で一緒にできるならいいんだけど
904:無名草子さん
22/12/26 21:56:54.15 .net
表記揺れはand検索でどうとでもなるからそのために本文を改変する必要はないと思うな
905:無名草子さん
22/12/26 22:12:08.36 .net
それがどこまで網羅できるのかって話だけどね
データベースでも作るなら別の話になるけど
906:無名草子さん
22/12/26 22:42:57.71 .net
当たり前だけどUnicode対応するといままで包摂適用してきた多くの文字をそのまま使えるようになるので外字注記辞書の更新も必須
907:無名草子さん
22/12/26 22:57:50.51 .net
>>903-905
今まで、それを比較検証することすらできなかったわけで、
「HD画質は皺が目立つから良くない」みたいな後ろ向きな現状維持は見苦しい
908:無名草子さん
22/12/27 03:09:19.99 .net
検索ツールの責をデーターに帰してどうすんだ。
909:無名草子さん
22/12/27 03:38:57.56 .net
>>908
誕生から25年経ったのに、青空文庫の書式に対応した検索ツールが皆無という現実がすべてを物語ってるでしょ
910:無名草子さん
22/12/27 03:49:22.35 .net
データーの責を検索ツールに帰してどうすんだ。
911:無名草子さん
22/12/27 10:17:59.51 .net
URLリンク(csd.ninjal.ac.jp)
既に青空文庫の全文検索コーパスは存在しますよ
912:無名草子さん
22/12/28 01:12:10.34 .net
「大岡政談」は、テキストファイルのサイズが青空文庫唯一の2MB越えで、ルビが75892個もあるんだね
今、未申請ながら入力してる作品もルビ35000個を超えているんだけど、上には上がいるってことでちょっと安心した
913:無名草子さん
22/12/28 12:10:04.65 .net
画像生成AI「Stable Diffusion」で青空文庫の名作小説に挿絵をつけてみた!【特集・集中企画】 - 窓の杜
URLリンク(forest.watch.impress.co.jp)
914:無名草子さん
22/12/28 12:40:06.43 .net
>>913
タイトルは面白いと思ったが本文くっさ
漫画☆太郎の100%パターンマンガとどちらが下だろうと悩むほどに
915:無名草子さん
22/12/29 18:44:44.53 .net
底本のページ番号に特化した注記があればいいなあ
外部プログラムに底本のページ番号を渡すことで該当する画像ファイルなりPDFなりをすぐに開けると校正が楽になると思うんだが
916:無名草子さん
22/12/30 16:52:31.43 .net
来年は溜めてる作業を消化しような
917:925
22/12/30 16:57:45.24 .net
「来年は」というか「来年こそは」だわ
918:無名草子さん
22/12/30 17:11:21.75 .net
来年は一体どうなるんだろうねぇ
まだ新年の公開作品の情報も出てないから完全に更新止まっちゃうのかな……
919:無名草子さん
22/12/30 19:22:38.00 .net
未申請のまま入力に取りかかろうかと考えている
もしも他の人と作業がダブってしまってふいになったとしても
自己責任、自業自得ってことで
Unicode化や注記の仕方など
大きな仕様変更があるかもしれないが
それでも一年間なにもせずにいられそうもない
920:無名草子さん
22/12/30 20:19:48.47 .net
2022年12月23日に出された充電期間の通知よりも前に申請したんだが、未だに連絡メールが来ない
まだ4週間経ってないから待ってるけど、どうなるのかな
>>919
重複を回避できる仕組みがあればいいんだけど、やたら申請だけしてほったらかしにされると困るので、
青空文庫の中の人による集中管理によらない、入力者間のゆるい情報交換の仕組みがあればいいと思う。
Githubのissue機能(メール通知や状態管理できる2chスレッドみたいなもの)を使えば作品ごとに重複回避や作業分担できそう。
921:無名草子さん
22/12/30 20:25:16.14 .net
ググルのような工程表を用意し
この通りにやらないと優先度が落ちて行って最終的には申し込み自体消滅でいんちゃうの
922:無名草子さん
22/12/30 20:32:17.11 .net
>>921
言いたいことはなんとなくわかるよ
けど、ガントチャートはスケジュールを中央で一元管理する人がいて始めて成り立つものなので、
ガントチャートの逐次更新にこだわると青空文庫の中の人の仕事が逆に増えてしまう恐れがある
毎日のようにたくさんの作品が放り込まれてくる青空文庫には、なじまないかもしれない
923:無名草子さん
22/12/30 20:36:46.66 .net
参加者皆で確認して行く方向が大事だと思う
管理者は10名ほど横繋がりでやり取りできる状態になると良いな
924:無名草子さん
22/12/31 08:52:43.28 .net
2023年も山周祭りか?
925:無名草子さん
22/12/31 12:19:09.33 .net
その話題は荒れるもとだからやめよう
926:無名草子さん
22/12/31 13:35:20.67 .net
中の人もここ見てくれてるのだろうか?
だとすればここでブレインストーミング的にたくさん意見を出しておくと何かに活かされるかもしれんという希望が
927:無名草子さん
22/12/31 16:05:03.93 .net
工作員のみんな今年もお疲れ様
来年は色々変化があるのだろうけどぼちぼちよろしく
928:無名草子さん
22/12/31 20:10:48.61 .net
皆の活動が名作を支えてる
読者として楽しんでます
青空読んでたら何でか文庫本も買うようになって
変な逆転現象も出てる
929:無名草子さん
23/01/01 05:18:51.35 .net
みんなあけおめ
2023年01月01日 『電子アーカイヴ』はしばし電気をためて夢を見る
URLリンク(www.aozora.gr.jp)
930:無名草子さん
23/01/01 17:38:48.70 .net
>>928
うれしいよ、ありがとう!
931:無名草子さん
23/01/01 20:06:27.66 .net
昨年で校了になっている作品は、今「校了」になってるので全部なのだろうか
いま点検グループさんの手元にある作品は、いったん作業中止って扱いになるのだろうか
(入力校正の新規受付がストップするのは分かったけど……)
932:無名草子さん
23/01/01 20:13:25.98 .net
>受領後点検と「校了」ステータスの完全再開は、新データベースシステムの本運用開始と高品質ファイル作成に目処がついてから
そういうことだろうね。
運用システムが万全になるまでは、「校了」に移行することはないということ。
なぜなら高品質ファイルにするために何らかの仕様変更をする可能性があるし、
そうなれば、すでに送ったファイルでも、校正者に再度返す必要がある。
933:無名草子さん
23/01/01 20:16:11.34 .net
校了したら、点検グループは必ず当日中に校正者にお疲れメールをくれる。
それがないということは
昨年中の校了作品は、今データベースで「校了」になったものがすべてで、あとは作業停止と思ってよいはず
934:無名草子さん
23/01/01 20:18:21.64 .net
自己レスごめん
>>933
>それがないということは
上の質問者さんが心配しているのは
「昨年中に自分の送った校正ファイルはどうなっている(どうなる)のか?」
ということだろうと想像して答えた。
935:無名草子さん
23/01/01 21:34:25.53 .net
>>931です。
ありがとうございます。
私は特に自分の担当している作業中作品はありませんが、
(いちおう一作品だけ入力申請していましたが未回答)
昨年の内に校正中になった自分の担当作品が多く、
それらが今後どうなるのか気になってました。
初心者の方が校正している様子も見受けられるので、
混乱が生じないことを祈りたいです……
936:無名草子さん
23/01/01 21:43:45.15 .net
今月の予定は?
937:無名草子さん
23/01/01 21:57:33.56 .net
>>935
あまり新人を敬遠する発言はしないでほしい
新人でも精力的な人は精力的だし
点検Gもサポートしてる
938:無名草子さん
23/01/01 21:59:23.15 .net
十年以上校正者がいない作品もあるのに
手を上げて校正してもらえる人が現れただけ幸運だよ
939:無名草子さん
23/01/01 22:08:27.84 .net
厳格にやるべきは著作権など権利の確認で、校正はそれほど厳格にしなくても良いと思うんだが、
「ウォーリーを探せ」よろしく、入力間違いを沢山見つけた強者を月間・年間ランキング表示するゲーム感覚でいいんじゃないの。
ま、暴論だけどさ
940:無名草子さん
23/01/01 22:39:28.25 .net
>>937
そうですね。
申し訳ございません。
私も参加したのは近年からですので、どちらかと申せば初心者です。
今回のリニューアルを機に、
いまだ校正されていない作品に光が当たりますように。
長文作品は「ドグラ・マグラ」のように交流しながらグループで行えるのが理想ですね。
941:無名草子さん
23/01/01 23:14:39.93 .net
>>939
「歴史的仮名遣いを現代仮名遣いに改めた」とか「明らかな誤植を修正した」とか「使用する文字コードに存在しない文字を画像で挿入にした」みたいに
やむを得ない理由がないのに内容を変えて公開したら同一性保持権の侵害になるんだから内容の正確性はそのまま著作権の論点になるよ
同一性保持権などの著作者人格権は保護期間みたいな制限がないからね(著作権法60条参照)
942:無名草子さん
23/01/01 23:36:35.04 .net
>>941
読者の視点でざっと読んで、違和感なかったらOKってことでいいんでないかな。
より細かい間違いを見つける作業は、一般人に委ねたらいいと思う。
参加型や逐次更新というWebの強みを活かさない手はない。
943:無名草子さん
23/01/01 23:49:06.92 .net
古いファイルを見てると、工作員の独断で勝手に校閲したらしき部分を見つけることが時々ある
(底本通りではなく、別な本を見て直したように見えるが誤記注記がない、とか)
あと底本だか親本だかの版が存在しない版(発行日も刷数もでたらめ)だったこともあったな
あんまりゆるくするとそういうのが増えかねないから、校正はそれなりにちゃんとした方がいい、と思う
944:無名草子さん
23/01/01 23:53:58.96 .net
>>942
OKなわけないじゃん
むしろ悪質だろ
調べに調べた上での誤りは致し方無い部分もあるかもしれないが
他人の書いた文章をお前の怠慢で改竄して公開する権利は無い
945:無名草子さん
23/01/01 23:56:48.77 .net
逐次更新と簡単に言うけど
少なくとも従来のシステムでは
技術的にも人手的にも簡単なことではなかった
それに青空文庫は出鱈目で信頼性が低いと酷く叩かれた過去だってある
新システムでファイル差し替えがどの程度容易になるかは分からないが、
それに甘んじず校正はきちんとやって信頼度の高いものを提供した方がいい
946:無名草子さん
23/01/01 23:58:02.24 .net
>>944
え?
すでに次世代デジタルライブラリーでOCRによって改竄(いわゆる誤検出)された作品が大量に公開されてるよ
「悪質」かどうか誰が決めるの?
947:無名草子さん
23/01/02 00:00:25.46 .net
というか951は工作員なのか読者なのかどういう立場で言ってるのか気になる
工作員だったら自分の作業には責任も誇りも持って受け持ってると思うので、なかなかこの発想にはならんと思うんだな
948:無名草子さん
23/01/02 00:03:05.72 .net
>>946
次世代デジタルライブラリーはそれ自体が研究検証目的の実験的取り組みだ
同列には語れん
949:無名草子さん
23/01/02 00:05:00.38 .net
>>942
底本をもたずに無料で読みに来る読者に細かい間違いを指摘させるってどんな無謀な期待よ
950:無名草子さん
23/01/02 00:06:36.71 .net
>>947
誇りを持つのは自己満足で勝手にどうぞって感じだけど、責任はなんにも背負ってないでしょ。
それとも賠償責任とか負うの?
学術論文で引用された作品が間違ってたら署名つきで謝罪するとか?
あまり言葉遊びしないほうがいいと思うよ
951:無名草子さん
23/01/02 00:07:54.97 .net
小並感
952:無名草子さん
23/01/02 00:19:35.24 .net
>>946
次世代デジタルライブラリーは「実験的な検索サービス」と謳ってるように青空文庫みたいな読むためのものではないし
OCRテキストと資料の画像を紐付けることによって内容の正確性を担保(補完)してる
それに公開時点で誤字・脱字・衍字があった時点で単純に悪質なのよ
953:無名草子さん
23/01/02 00:28:34.68 .net
そのへんの感覚が希薄な耕作員がいるとしたら恐ろしい
954:無名草子さん
23/01/02 00:31:27.81 .net
>>952
紙書籍の考えを引きずらなくていいと思うよ
間違ってたら更新すればいいだけ
紙書籍はハードウェアなので配布してしまったものを簡単に修正できないけど、
Web書籍はソフトウェアなので簡単に修正できる
青空文庫はなんの社会的責任も負っていないし、
ましてや君主でもないので「綸言汗の如し」のことわざはまったく当てはまらない
955:無名草子さん
23/01/02 00:39:36.93 .net
君子は豹変す
956:無名草子さん
23/01/02 00:40:19.52 .net
>>954
で、その更新(修正)前に読んだ人にはどう対応するつもりなの?
その誤字部分のせいで駄作だと思われたら確認にも来ないよね?
957:無名草子さん
23/01/02 00:43:01.62 .net
間違ってたらデータを更新すればいいだけだからこそ公開までに何人もの目を通して修正を施してるんでしょ
958:無名草子さん
23/01/02 01:00:08.06 .net
>>956
今も対応してないでしょ
てへぺろで十分
959:無名草子さん
23/01/02 02:06:09.13 .net
ocrの認識率が99%だとして、百字に一字も誤字がある文章なんて読めたもんじゃないから、そのまま公開しても「ざっと読める」クオリティには到底ならないと思う
現状は「ざっと読める」ようになるまで結局誰かの校正が必要。だとすると今とそんなに手間は変わらないんじゃないか。
ocrの認識率が今後伸びればまた違うのかもしれないが。
ただ、みん翻みたいな感じでみんなで校正できたらそれはそれで楽しそうだとは思う
けどそのシステムの実装のために式年遷宮が5年くらい伸びそうな気もするな。
960:無名草子さん
23/01/02 07:32:01.37 .net
>>945
の言う通り従来のシステムでは逐次更新そのものが面倒というのもそうだが、
青空文庫本体を更新したとしても、そこから作られて別なサーバに置かれてるファイル、
たとえばKindleで無料でダウンロードできる(赤と黄色の表紙の)ファイルなんかは
古いままだから、そっちを利用してる人は古いファイルを使い続けることになる
という問題もある(実際、青空の方は直ってるのにKindleの方だけ見て誤字がーって
愚痴ってる人を見たことがある)
よく知らんけど、公共図書館の電子図書館とかにあるファイルもそんな感じなんじゃない
だとしたらやはり現時点では公開の前に十分なチェックが必要かと思う
961:無名草子さん
23/01/02 07:58:35.68 .net
>>960
青空文庫の最新版と同期を取る仕組みが必要って話でしょ
いつまでたっても古いままってのはどのみち問題なわけで。
公開前の十分なチェックとかやってるといつまで経っても10~20年物の待ち状態の作品をさばけないと思う
962:無名草子さん
23/01/02 10:24:56.27 .net
複数の工作員が校正を共同で作業してるのはたまにあるよね
963:無名草子さん
23/01/02 12:09:56.37 .net
>>958
十分じゃないから最初の公開までに点検なり校正なりしてるんだけどそれが分からないの?
964:無名草子さん
23/01/02 12:13:37.34 .net
適当でおk派はウィキソースに行ったほうが幸せになれるぞ
965:無名草子さん
23/01/02 12:38:50.63 .net
公開してからバグがあると問題であるとするなら
非公開サイト内で一般人に近い環境でファイルを読む、
テスターあるいはデバッガーとしての耕作員活動を募るというのはどうだろう
いずれにしてもボランティアだから
読みやすいものに査読者が偏るだろうけど
966:無名草子さん
23/01/02 12:54:11.23 .net
OCRから読み取るのと電子ブックからコピペしたのを貼り付けるのと何が違うんだろう
文章が全く同一の場合は何も変わらないのだろうか?
967:無名草子さん
23/01/02 13:06:45.25 .net
そりゃそうだ
同一なら同一
968:無名草子さん
23/01/02 13:13:07.19 .net
漢数字の「二」がカタカナの「ニ」になってたりすると
ocrに読み込ませて失敗したななんてことは思います
969:無名草子さん
23/01/02 13:31:26.32 .net
一般人から、書写者(早口で三度言えたらお前の勝ち)へ誤字をフィードバックする仕組みを作れよ。
970:無名草子さん
23/01/02 13:55:56.90 .net
>>969
それはホントに思う
kindleとかは誤字を簡単に報告する仕組みが出来てるけど
そんな感じで「これ、おかしいんじゃない?」って思うのを
気軽に送信してチェックしてもらえると嬉しい。
ちゃんと底本確認してから報告しろと言われるとハードルが
とてつもなく上がる。
971:無名草子さん
23/01/02 13:56:54.35 .net
たださ、青空文庫ではウィキソースと違ってママ注記を乱発しないんだよ
現代の用法と照らして間違ってるというだけでは、青空文庫ではママ注記しない
誤字通報フォームには、「□利用規約に同意します」よろしく
その旨(青空文庫の公式な「誤字、誤用」に対する考え方)理解を求めないとならんだろう
972:無名草子さん
23/01/02 13:57:29.56 .net
>>970
殺到の予感
973:無名草子さん
23/01/02 14:02:14.26 .net
その仕組みがないために誤字だらけの作品を公開し続けるのも
不味いのではないかなんて思うのですが
その辺は皆さんどうお考えでしょうか?
974:無名草子さん
23/01/02 14:03:24.64 .net
自分がその気軽な連絡を受けてチェックする側にいても同じこと言えるの?
975:無名草子さん
23/01/02 14:04:06.96 .net
>>974
言えると思いますがなにか?
976:無名草子さん
23/01/02 14:04:40.30 .net
すげえな
俺は言えない
977:無名草子さん
23/01/02 14:10:35.10 .net
一般読者は>>971を理解してない
だから同じ件や類似の件に何度でも報告してくる可能性がある
同じだからといってテンプレ対応はできない
報告が本当に単なる誤植なのかどうか、ママなのか、注記なしなのか、底本や親本を探してくるのもこちら、
該当箇所にあたって判断しなくちゃならないのはこちらだ
これを一件ずつな
978:無名草子さん
23/01/02 14:12:59.85 .net
次スレ建てときました
青空文庫 12棚目
スレリンク(books板)
979:無名草子さん
23/01/02 14:13:27.14 .net
>>978
乙です
どうもありがとう感謝します
980:無名草子さん
23/01/02 14:47:19.75 .net
>>977
こちらってのは青空文庫側ってことか?
もちろん厖大な誤字報告に対応できるくらいの人手があればできるだろうけど、ないんだから現実的に無理じゃん。
そもそも底本確認することがハードルになるほど難しい事とは思えないから
報告者が底本まで確認して連絡するのが妥当だと思う。
どんな事だって間違いするときは客観的な根拠を示すのがフェアなんだから。
981:無名草子さん
23/01/02 14:48:52.99 .net
>>980
間違いする→間違いを指摘する
982:無名草子さん
23/01/02 15:32:42.06 .net
>>980
それほどハードルが高くないって思われるなら
そういう方にその役割を担っていただきたい。
読んで誤字を見つけるのが得意な人もいれば
底本を入手しやすい立場でチェックを得意とする方もいるだろうし
うまく得意分野を合わせて問題解決してほしいです。
誤字だらけの作品を公開されているのは
いくら著作権が切れてるといえ
作者は不本意だとおもうのですが。
983:無名草子さん
23/01/02 16:00:26.64 .net
「作者は不本意」も何も遺族は訴えられるからね
著作者人格権の侵害は500万円以下の罰金だし
984:無名草子さん
23/01/02 16:00:42.10 .net
おお、ここはOCRを校正に使えると思っている幸せな人をたしなめるスレですね
985:無名草子さん
23/01/02 16:04:42.70 .net
誤植確認申請フォーム的なのを作るとしたら図書カードのURLや本文の該当箇所をテキストで入力する以外に
底本画像の該当ページと奥付の添付も必須にすればだいぶマシになるとは思う
(出版後70年経過してない場合の対応に困るんだけど)
流石に捏造する愉快犯は出てこないでしょ
986:989
23/01/02 16:10:39.13 .net
>>982
そもそも自分でチェックせずになぜ誤字と判断できるのかわからんな。
「誤字かも」「誤字な気がする」とかそんなレベルの連絡に対応するのは人手があればやれるのは確かだが
だとしても本来、やる筋合いはない。
987:無名草子さん
23/01/02 16:14:54.20 .net
遺族から「ここがおかしい」と言われたら直せばいいだけでしょ、
回収せずに改修できるのがWeb書籍の強み
回収が容易でない紙書籍とは違うのだよ、紙書籍とは
988:無名草子さん
23/01/02 16:17:58.47 .net
工作員としてやることがなくなるととなんかみんな変な感じになっちゃうな
989:無名草子さん
23/01/02 16:18:11.20 .net
>>984
なにいてんの?
使えるのに使えないと誘導しようとしてるのかね
悪質だねぇ
990:無名草子さん
23/01/02 16:23:16.21 .net
>>987
その杜撰さで運営したら誰も見向きもしなくなるって想像つかないの?
991:無名草子さん
23/01/02 16:23:23.38 .net
1000
992:1001
Over 1000 Thread.net
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 243日 19時間 9分 5秒
993:無名草子さん
23/08/01 18:56:54.43 CbaCMKFv6
都心まて゛数珠つなぎて゛航空騷音まみれにして勉強まて゛妨害する最惡の現状をスルーしながら、未来ヘの投資(大爆笑)た゛のと主張して
孑どもではなく子を持つ親に赤の他人から強盜した血税くれてやれだの私権侵害甚た゛しいバ力ほざく腐敗主義のキチカ゛ヰがいるけど,
Gоtоなにか゛し同様,地球破壊するテロリストとともにてめえのクソ利権を増大させて私腹を肥やしたいた゛けなのか゛ハ゛レハ゛レた゛ろ
税の公平性すらカ゛ン無視だし、貧乏だけど孑を産んでいいのかしらとか勘違いさせて不幸な孑を量産させる史上最惡の税金泥棒だわな
介入するなら.親ガチャ失敗を緩和するために.孑を産んだら親にひとりあたり5千万は課税して物品やらを直接,子に給付させるのか゛限度
もちろん払える見込みか゛なけれは゛遺棄罪で逮捕懲役,日当5千圓で塀の中から孑に送金させろや寄生虫,てめえの孑の保育すら放棄して
保育園がと゛うたら学童がと゛うたら虐待がどうたら他人が払った税金くれだの恥知らずもいい加減にしとけ寄生虫ババァ
北朝鮮にウクラヰナに子と゛もまて゛ネタに地球に社会にと破壞してて゛も私腹を肥やしたい外道に騙されないようにな
創価学會員は、何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最悪の殺人腐敗組織公明党を
池田センセ-か゛ロをきけて容認するとか本気で思ってるとしたら侮辱にもほどがあるそ゛!
htтps://i、imgur.сom/hnli1ga.jpeg