文字コード総合スレ Part12at TECH
文字コード総合スレ Part12 - 暇つぶし2ch207:デフォルトの名無しさん
19/03/08 14:51:06.96 uMMKH+w1.net
概出?
URLリンク(qiita.com)

208:デフォルトの名無しさん
19/03/08 18:46:01.42 soybuSeV.net
その読みにくい文体、中学のマイコン部の先輩が部誌に書いてたコラムに似てるなと思った

209:デフォルトの名無しさん
19/03/08 18:58:34.86 8O+4MLhG.net
内容はともかく
> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<URLリンク(qiita.com)
↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。

210:デフォルトの名無しさん
19/03/08 19:17:05.59 orP5LHkV.net
苦情が出た時のために拡張領域があるんだから許してあげてよ。

211:デフォルトの名無しさん
19/03/08 20:40:25.47 9ZplOVC2.net
小さいゐゑヰヱは "used to write archaic Japanese" なんだけど
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった

212:デフォルトの名無しさん
19/03/08 20:41:24.22 9ZplOVC2.net
同じってのはヲの方だけど

213:デフォルトの名無しさん
19/03/08 22:42:36.27 orP5LHkV.net
リンゴロゴ(U+F8FF)を使った Tim  が正しく表示される環境は限定的なのかな?
私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
URLリンク(www.afpbb.com)
 【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
 ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
 公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。
 トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
 アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。
 するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
 ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
 「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
 「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
 「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。
 ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
 ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
 昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP

ティム・クック氏のツイッター・アカウント
URLリンク(twitter.com)
(deleted an unsolicited ad)

214:デフォルトの名無しさん
19/03/08 23:59:07.12 AN9FdtGs.net
Private Use Area を公にさらす変態

215:デフォルトの名無しさん
19/03/09 00:06:34.07 bJz0o3uK.net
私用領域U+E50Aが渋谷109の絵文字に割り当てられているツイッターさんの前でも同じこと言えんの?
URLリンク(twitter.com)
(deleted an unsolicited ad)

216:デフォルトの名無しさん
19/03/09 03:14:15.24 JZDf7HgY.net
Tim Appleと呼ばれたTim Cook、Tim Tofuを名乗る。

217:デフォルトの名無しさん
19/03/09 07:26:47.29 ZOfzHyh2.net
>>207
>CJK文化圏にいる利用者からは扱いずらすぎる
わざとそれを狙って毒撒いたんじゃね?

218:デフォルトの名無しさん
19/03/09 07:28:53.38 JheZ4dDX.net
>>207
ぁたιゎゆるさナょぃ

219:デフォルトの名無しさん
19/03/09 20:48:52.13 3uujbs1q.net
>>192
URLリンク(www.unicode.org)
使えるように直ったっぽいよ。

220:デフォルトの名無しさん
19/03/10 00:01:29.10 cA8Bnujj.net
>>216
「あたしわゆる」の後なんて書いてあるの?

221:デフォルトの名無しさん
19/03/10 00:29:48.57 XmX8U4WX.net
>>218
さない
「あたしわ ゆるさない」 だろ

222:デフォルトの名無しさん
19/03/10 17:51:22.00 uFsYqTSV.net
>>207
長すぎてどこまで読んだか判らない
>>217
ありがとー

223:デフォルトの名無しさん
19/03/11 11:18:28.54 PmMIa9FT.net
>>220
>>192は俺な訳だがなぜ無関係なあなたが返事をしているんだw

224:デフォルトの名無しさん
19/03/11 12:16:12.73 tDJ/xRRJ.net
我は汝、汝は我。 禁断の叡智は開かれた。

225:デフォルトの名無しさん
19/03/14 16:59:19.77 ZsZ3eZF+.net
UAX #29: Unicode Text Segmentation
URLリンク(www.unicode.org)
Unicode 12.0.0 では新しく U+FF10..U+FF19 の全角数字を数字扱いするようになったのね。
UAX #14 では Ideographic のままだし何で今頃変えたのかよく分からないけど。

226:デフォルトの名無しさん
19/03/14 22:33:54.00 +YVU0bVz.net
これから漢数字とか丸数字も数字扱いしだすゾォー^
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ

227:デフォルトの名無しさん
19/03/15 00:54:56.25 h1OQ6sr0.net
>>223
まじかよ
互換性がとも思うけど,寧ろ便利なのかな。

228:デフォルトの名無しさん
19/03/15 06:30:19.25 /rrmc9zm.net
ダブルクリックで文字列選択するような機能に影響でなければいいけどなあ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ

229:デフォルトの名無しさん
19/03/15 06:41:57.81 t7/3/Ky+.net
Unicodeじゃなくて個別のライブラリの仕様次第だと思うけど、近い将来影響が出てきそうだね。

230:デフォルトの名無しさん
19/03/15 12:06:24.49 JrKcPYyj.net
>>226
うわあ

231:デフォルトの名無しさん
19/03/15 12:07:15.17 JrKcPYyj.net
そういえば(今もそうかは知らないが)Firefoxは「々」がそういう選択のされ方だった。あれはなんでなんだろう。

232:デフォルトの名無しさん
19/03/15 14:05:00.83 SEjqglYP.net
漢数字の数字扱いまだ?

233:デフォルトの名無しさん
19/03/15 15:31:55.15 oAURdopD.net
そして参とか陸とかまで数字扱いされて地獄へ

234:デフォルトの名無しさん
19/03/15 15:39:45.46 a2hOwysQ.net
ソート順が萬>千>百>拾とかか

235:デフォルトの名無しさん
19/03/15 19:19:14.57 WyyrIOit.net
Unicode 11の時点で十進法表記に基づく0-9相当の文字はNumeric扱いされてたようだから
FF10..FF19は確かに漏れだな
URLリンク(www.unicode.org)

236:デフォルトの名無しさん
19/03/15 19:36:37.30 t7/3/Ky+.net
正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。

237:デフォルトの名無しさん
19/03/22 01:21:11.28 8w4+OmEG.net
ふむ

238:デフォルトの名無しさん
19/03/23 19:29:06.12 4GARFTFw.net
ふまない

239:デフォルトの名無しさん
19/03/23 23:02:35.35 GanpYc3U.net
ふまれたい

240:デフォルトの名無しさん
19/03/24 03:18:52.69 OrJDHzVf.net
フモフモ

241:デフォルトの名無しさん
19/03/24 11:24:12.73 Rpzr04ID.net
もふもふ

242:デフォルトの名無しさん
19/03/24 14:16:39.59 2vsRyi47.net
このスレかどっかでC99で作られたUnicodeライブラリの紹介を見掛けた気がするんだけど
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです

243:デフォルトの名無しさん
19/03/24 14:32:46.63 DqM6OskA.net
過去様が卒業したとこ

244:デフォルトの名無しさん
19/03/24 16:01:40.15 4oYv+rwZ.net
未来様。

245:デフォルトの名無しさん
19/03/27 17:42:59.30 WhOBGSwK.net
ICUは有名なのですぐ見付かるだろうしなによりC99じゃない。
utf8procじゃねーの?

246:デフォルトの名無しさん
19/04/01 17:18:38.72 89NTFMVc.net
このスレのみんなは㋿だって先に知ってたんだな

247:デフォルトの名無しさん
19/04/01 20:45:19.42 rsPxYoMK.net
お前ら、システム改修の時は互換漢字もちゃんと考慮しろよ
URLリンク(twitter.com)
(deleted an unsolicited ad)

248:デフォルトの名無しさん
19/04/01 22:00:00.14 ID


249::SiO8nKzk.net



250:デフォルトの名無しさん
19/04/01 23:51:37.27 PpRhn1A4.net
てか「人一卩」と「人丶マ」は異体字セレクタにあるけど、官房長官が掲げた「人丶卩」が無いな

251:デフォルトの名無しさん
19/04/02 02:25:50.36 v8tjfRTs.net
Gengo-Oshuujiコレクションを申請するときがきたか

252:デフォルトの名無しさん
19/04/02 07:20:09.23 DRYM+8L2.net
あのお習字も公文書扱いらしいな
汎用電子あたりにぶち込んでいいぞ

253:デフォルトの名無しさん
19/04/02 10:10:03.96 GTYTa8Tr.net
個人的には新元号に2004年のJISで例示字形変更された字や第2水準以下の字が使われなくて良かったと思ってる。

254:デフォルトの名無しさん
19/04/02 12:05:10.00 5+C+zQyU.net
>>245
そんな大事な話でFA98とF9A8間違うとか絶対わざとやってるだろ
消して投稿しなおせよ

255:デフォルトの名無しさん
19/04/02 12:10:05.14 5+C+zQyU.net
>>247
そもそも字が下手過ぎて習字の基本すら出来てないやろ
和にしても
ノ木口
なのに
ノ丶木口
って描かれてる

256:デフォルトの名無しさん
19/04/02 14:05:03.11 k+6mhhx+.net
新元号「令和」と文字コード(主にUnicode)の問題
URLリンク(togetter.com)

257:デフォルトの名無しさん
19/04/02 18:12:09.33 ONyiz5iP.net
アドビのフォントが新元号「令和」に対応--2パターンの合字を追加
URLリンク(japan.cnet.com)
この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。

258:デフォルトの名無しさん
19/04/02 21:47:42.61 qF1eZplP.net
集合住宅名にありがちシリーズだと㌞・㌪はあるがヒルズとかテラスとかがないな

259:デフォルトの名無しさん
19/04/02 23:57:38.32 6o2aISb6.net
いらんわ

260:デフォルトの名無しさん
19/04/03 19:17:17.44 1gOVHweX.net
Unicodeに入れるのはむりぽ
AJ1ならワンチャンあるかも

261:デフォルトの名無しさん
19/04/03 22:13:58.47 FgHYrjKu.net
>>250
誰でも読み書き出来る字を選ぶという配慮であろう。
令は小学4年、和は3年で習う字だ。
今時のキラキラネーム(DQNネーム)とは違う。

262:デフォルトの名無しさん
19/04/03 23:15:11.57 cN3kYbRs.net
常用漢字から選ぶとは最初に告知されてたが、
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。

263:デフォルトの名無しさん
19/04/04 00:45:49.30 gljFUA1G.net
あの「令和」っていう習字の画像って公文書として入手できないのかな。

264:デフォルトの名無しさん
19/04/04 01:42:15.29 WKiiXHnA.net
習字の意味分かってる?

265:デフォルトの名無しさん
19/04/04 02:37:07.88 RbPEvSJ+.net
どのメーカーの半紙と墨汁を使ったか公開すればバカ売れだな

266:デフォルトの名無しさん
19/04/04 03:17:29.09 sXgQQUMv.net
字が下手過ぎた
やり直せ

267:デフォルトの名無しさん
19/04/04 08:30:46.45 VfgtU/Z4.net
URLリンク(twitter.com)
令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?
これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
(deleted an unsolicited ad)

268:デフォルトの名無しさん
19/04/04 13:53:52.02 lQbbBBhx.net
リとり間違うような恥ずかしい間違いだな

269:デフォルトの名無しさん
19/04/04 15:25:32.68 c6BVWPCA.net
>>264
電子化された契約文書に大正の年号が使われることがないから影響もなかった。

270:デフォルトの名無しさん
19/04/06 15:08:14.87 uziyxFMz.net
大正時代に生まれた人なんかいくらでも電子管理の対象になりうるだろ

271:デフォルトの名無しさん
19/04/06 19:32:01.25 EXSfDg77.net
大正はIME類に成語として登録されてるからよっぽどでもないかぎり他の大は出てこんわね。
でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。

272:デフォルトの名無しさん
19/04/07 11:42:20.44 8ULyWhed.net
じゃあ令和もIME登録したらいい,って思っちゃうのは素人考えなんですかね。

273:デフォルトの名無しさん
19/04/07 14:27:30.40 LEvc5MB9.net
他人のIMEに一括登録できるなら何かのプロだな。
あるいは単に問題を取り違えてる素人かもしれん。

274:デフォルトの名無しさん
19/04/08 00:28:20.42 gS267+Xj.net
令和
令和

275:デフォルトの名無しさん
19/04/08 12:50:59.09 mdLXKZZ1.net
江戸時代の地震記録した古文書495点 市民参加して解読完了!「くずし字学んだ」 2019年04月07日 06時00分 @ハザードラボ
URLリンク(www.hazardlab.jp)
URLリンク(www.hazardlab.jp)
江戸時代の古文書に記録された災害の歴史。くずし字を現代文字に直しながら読んでいくプロジェクトだ(京都大)
京都大学は、地震研究所図書室が所蔵する江戸時代の地震を記録した古文書495点の解読を終了したと発表した。
2017年1月にスタートした解読作業は、4600人を超える一般市民が参加してくずし字で書かれている古文書を、一字ずつ現代文字に活字化するという
プロジェクトで、過去の災害の歴史を学ぶきっかけにつながるという。
古代から地震が多かった日本では、『日本書紀』に残る416年の「允恭(いんぎょう)地震」を最古として、数多くの史料が残されている。しかし、解読されたのは
そのうちのほんの一部で、有益な情報のほとんどが手付かずの状態だ。

276:デフォルトの名無しさん
19/04/08 12:51:41.80 mdLXKZZ1.net
くずし字学習アプリを使ってゲーム感覚で学ぶ
URLリンク(www.hazardlab.jp)
翻刻が終わった『地震年代記』(国立民族博物館)
京都大学大学院の「古地震研究会」は2017年1月、東大地震研究所の図書室が所蔵する古文書495点をインターネット上に公開し、Wikipediaのように閲覧者が
現代文字に書き換えるプロジェクトを開始。これまでに4626人が登録し、このうち347人が実際に文字の入力作業に参加した結果、新書30?35冊分の文字数に
あたる465万文字が入力されたという。
「みんなで翻刻」というこのサイトには、数多くのくずし字のパターンや、江戸時代の本から収集した3000種類近い熟語が収録されており、
くずし字学習支援アプリと連携することで、初心者でもくずし字を学ぶことができる機能が備わっている。(翻刻=文字起こし)
過去の災害の歴史を学ぶきっかけに
URLリンク(www.hazardlab.jp)
学習アプリを使って、ゲーム感覚でくずし字を学ぶ
スタート当初は、地震研究所二代目所長をつとめた地震学者の石本巳四雄(みしお)氏がコレクションした114点の災害史料の翻刻を目標としていたが、
開始から5カ月後には完了。その後、資料を追加することで495点すべての作業が終わった。
今後は、ほかの資料館が所蔵する史料も登録を進め、翻刻を続ける計画なので、興味がある人は今からでも遅くない。パソコン1台あれば誰でもアクセス
できるので、ぜひ一度サイトを訪問してほしい。古文書の解読の楽しさはもちろん、自分が住んでいる地域で過去に起こった地震の歴史を学ぶこともできる。

277:デフォルトの名無しさん
19/04/08 12:54:44.65 mdLXKZZ1.net
みんなで翻刻
URLリンク(honkoku.org)

278:デフォルトの名無しさん
19/04/09 12:37:03.63 cLV16Pee.net
UTF-8って、制御コード含まれることはないんだっけか

279:デフォルトの名無しさん
19/04/09 13:07:46.20 9ML7UTJk.net
だぶりのコードもあるし
不正コードでおかしくなるシステムもある

280:デフォルトの名無しさん
19/04/09 14:29:47.00 KelUteYn.net
だぶりのわたなべさん

281:デフォルトの名無しさん
19/04/09 23:57:15.76 7iU2pxay.net
最短ではないutf-8を不正としない処理系
URLリンク(tech.nikkeibp.co.jp)
URLリンク(www.jpcert.or.jp)
URLリンク(www.slideshare.net)

282:デフォルトの名無しさん
19/04/13 16:03:07.58 UCcAxlmJ.net
東京パラのピクトグラム発表 全22競技を絵文字で表現
URLリンク(www.asahi.com)
2019年4月13日11時08分

283:デフォルトの名無しさん
19/04/16 14:56:33.54 l4UDEMAP.net
新元号名で使用する文字コードについて(周知)
URLリンク(www.meti.go.jp)

284:デフォルトの名無しさん
19/04/19 00:40:25.06 SszpXZZX.net
周知元年

285:デフォルトの名無しさん
19/04/19 00:42:08.08 E436SlHO.net
草なぎの剣って
なぎはどの字が正解?

286:デフォルトの名無しさん
19/04/19 00:45:03.52 p/ztoCUW.net


287:デフォルトの名無しさん
19/04/19 02:32:47.43 ixte0yp9.net


288:デフォルトの名無しさん
19/04/19 06:10:41.34 XxVTl/mO.net
草[データ欠損]の剣

289:デフォルトの名無しさん
19/04/19 14:43:52.39 K/dFwraF.net
wwwの件

290:デフォルトの名無しさん
19/04/19 15:47:39.94 y/MVEQAL.net
草なぎって芸柏lにいるよな

291:デフォルトの名無しさん
19/04/20 21:38:10.03 F8mbqA+i.net
>>254
Unicodeに収録されている「パーツ」と「ほか」が追加されるとUnicode仮名合字が揃うから最優先

292:デフォルトの名無しさん
19/04/21 01:51:55.93 ojSCyBaB.net
タイ行きたくなってきた

293:デフォルトの名無しさん
19/04/21 01:54:55.60 x0mJ9C0y.net
お?GoGoか?それともMP?w

294:デフォルトの名無しさん
19/04/21 13:49:25.89 tITQ2Bq3.net
>>254
これ使えって言われそうだ
&#x1f1ec;&#x1f1fc;

295:デフォルトの名無しさん
19/04/21 17:44:13.32 sl+JTl2l.net
どれや

296:デフォルトの名無しさん
19/04/21 23:16:48.91 oi8OpLnl.net
ψ

297:デフォルトの名無しさん
19/04/21 23:28:17.18 sMtprdSr.net
>>291
GW?

298:デフォルトの名無しさん
19/04/21 23:34:13.27 Ac4MsT8t.net
>>293
ソ連の旗に書いてあるやつ?

299:デフォルトの名無しさん
19/04/22 02:38:56.56 V0Ep5EOp.net
鋤?

300:デフォルトの名無しさん
19/04/22 03:12:27.93 3Wv0MOni.net
>>296
見ているとゲシュタポ崩壊してくる

301:デフォルトの名無しさん
19/04/22 04:58:25.98 K/a5X4tg.net
屮屮

302:デフォルトの名無しさん
19/04/22 06:48:42.73 LkdKQQlY.net


303:デフォルトの名無しさん
19/04/22 21:46:31.50 KyfckjPA.net


304:デフォルトの名無しさん
19/04/22 23:13:49.10 7Lb1KZDb.net
草ァ!

305:デフォルトの名無しさん
19/04/26 15:10:00.86 h/0smdVx.net
役所から『楷書体の“令和”の“令”の“マ”を明朝体のように縦棒に直せ』と指示がきた「どっちでもいいはずでは」
URLリンク(togetter.com)

306:デフォルトの名無しさん
19/04/26 16:10:02.69 ICRz1tVq.net
これ結果的に包摂への理解が世間に広がれるきっかけになればいいなあ

307:デフォルトの名無しさん
19/04/26 17:26:05.43 kg5yc1Gc.net
令の下はアベのアが正しいと閣議決定

308:デフォルトの名無しさん
19/04/26 20:07:56.08 vOVYhDJF.net
あそうのアと聞いたが

309:デフォルトの名無しさん
19/04/26 21:07:22.44 zkZoCC1n.net
昭和天皇「あっそう」

310:デフォルトの名無しさん
19/04/30 00:24:58.84 fTPg0Gzh.net



311:備は万全でしょうか?



312:デフォルトの名無しさん
19/04/30 02:48:38.56 qV7WSa+K.net
一応アプデして再起動した
URLリンク(support.microsoft.com)
いつでも来やがれ

313:デフォルトの名無しさん
19/04/30 03:08:50.84 SjzICe9T.net
影響なんぞあるかなあ?

314:デフォルトの名無しさん
19/04/30 10:48:06.61 O+RhbMFB.net
もし見える環境なら
これ


らしい

315:デフォルトの名無しさん
19/04/30 10:51:51.20 M/y36yih.net
裏向きですよ官房長官

316:デフォルトの名無しさん
19/04/30 19:08:38.83 mmURSAfG.net
理屈と軟膏はどこにでも付くなw

317:デフォルトの名無しさん
19/05/01 00:10:53.03 Cxjz7JYJ.net
皆さまご無事ですか?

318:デフォルトの名無しさん
19/05/01 03:27:20.94 zkmvQa1R.net
応答がありませんね…

319:デフォルトの名無しさん
19/05/01 16:53:36.94 qjSscuuh.net
Unicode、㍻ ㍼ ㍽ ㍾ のように一文字版の令和を追加
スレリンク(news板)

320:デフォルトの名無しさん
19/05/01 19:22:56.99 PSa6BJih.net
元号合字はBCだと思ってたのに
新しく増やす余地があるのなら慶応以前のもないと気持ち悪いなあ
保元とか平治とかちょうだいよ

321:デフォルトの名無しさん
19/05/02 02:19:04.44 oFArPNDY.net
ツイッターのオリジナル令和絵文字
URLリンク(abs.twimg.com)

322:デフォルトの名無しさん
19/05/02 02:56:54.78 fwW+HFuA.net
官房長官が額縁を掲げたという先例をそのまま踏襲したことにより、
将来にわたる日本の改元時儀式が爆誕した瞬間である

323:デフォルトの名無しさん
19/05/02 23:10:42.85 /beTzGTL.net
㍾ ㍽ ㍼ ㍻みたいなのってNECの外字由来じゃなかったっけ
なんで今さらシフトJIS時代の遺物の仲間みたいなものを増やすんだか

324:デフォルトの名無しさん
19/05/02 23:35:48.89 I+5xWFxb.net
「シフトJIS時代の遺物」に依存している人が少なからずいて、その人たちが令和のも作られるのを望んだんだろ

325:デフォルトの名無しさん
19/05/02 23:45:38.82 7n99qwI2.net
つってもシフトJIS時代の遺物アプリケーションでは使えないんだぞ。なんだそれ。

326:デフォルトの名無しさん
19/05/03 00:00:56.27 wXDfhaGQ.net
>>321
それで使えなくてもかまわないんだろ

327:デフォルトの名無しさん
19/05/03 00:03:09.80 97u3Xpxh.net
世の中の大部分のワープロソフトはunicode対応済みだからSJIS縛りはない。

328:デフォルトの名無しさん
19/05/03 08:59:56.88 zgghhlv4.net
U+32FFのスポンサーになるやつおらんの
URLリンク(unicode.org)

329:デフォルトの名無しさん
19/05/03 14:14:26.24 /bmAVHAq.net
>>319
IT技術者なら使わないけど、変換候補に出でくるものを使うのがなぜいけないのかと思うのが世の中の大半。

330:デフォルトの名無しさん
19/05/03 14:38:44.99 22DEOz6X.net
>>324
面白いお小遣い稼ぎだなと思ったが、
これ名前に主義主張とか入れて来る人がいたらややこしいことになりそうやな。

331:デフォルトの名無しさん
19/05/03 14:42:17.77 3Vz/qKoh.net
>>325
別に使っても良いと思うけど
それなら慶應より前のが全部入れろと
たかだか有限個なんだし楽勝だろ

332:デフォルトの名無しさん
19/05/03 14:46:59.15 Q171sR7D.net
>>327
入れるのを望む人が少ないから入らないんだろ

333:デフォルトの名無しさん
19/05/04 10:55:56.42 mtwbaS1U.net
KB4495667 適用記念カキコ
㍾㍽㍼㍻㋿
URLリンク(support.microsoft.com)

334:デフォルトの名無しさん
19/05/04 20:44:56.14 Hwt49Fxi.net
令和対応のWindows Updateは適用しないでください
URLリンク(osdn.net)

335:デフォルトの名無しさん
19/05/05 09:10:16.53 vN64IIVG.net
>>330
MS UI Gothicは等幅フォントだったのか

336:デフォルトの名無しさん
19/05/05 14:06:52.01 a/tGSf18.net
仮に慶応以前も入れるとしたらさすがにBMP外だろうな。

337:デフォルトの名無しさん
19/05/05 15:38:00.22 vTdWYBgo.net
>>330
ワロヌ

338:デフォルトの名無しさん
19/05/05 15:55:58.30 9Ygu+RTn.net
>>330
自分の設計ミスじゃねーかw

339:デフォルトの名無しさん
19/05/05 16:30:52.35 O86syOAN.net
GW入る前からそういう話を聞いてたけど
URLリンク(twitter.com)
(deleted an unsolicited ad)

340:デフォルトの名無しさん
19/05/05 16:49:51.40 2d0rYk3C.net
まあDLLバージョン非互換地獄みたいなのと根は同じと考えれば大変だなと思う

341:デフォルトの名無しさん
19/05/05 19:01:34.13 McO+DcFw.net
おそらく今世紀半ば頃になるだろう令和の次以降も組み文字入れるつもりなのだろうか?

342:デフォルトの名無しさん
19/05/05 20:35:38.58 l5IfNH0H.net
不思議なもんで平成31年がはるか昔のように感じられる。

343:デフォルトの名無しさん
19/05/05 21:59:40.84 i5vkPu2K.net
>>335
「?」を使って無くても不具合起きるってことか
Windows Form 使ってるところはヤバいんじゃないか

344:デフォルトの名無しさん
19/05/05 23:33:12.08 afKxHVhL.net
>>339
問題が出るのがWinFormsだけとは限らない(少なくともExcelは確実に再現する)らしいから
GW明けには大問題になりそうな気がするんだけど、いまのところ全然そんな話になってないのがちょっと怖い
まさか「令和」の合字を付け足すだけのWindowsUpdateで
フォント幅の定義が勝手に変更されるなんて思わないよな・・・・
不幸中の幸いは「Microsoftがやらかしたことなんで開発側も被害者です」と言い張れることか

345:デフォルトの名無しさん
19/05/06 00:01:39.11 Y5VmjYQ0.net
勝手に見た目が変わってしまうのは迷惑と言えば迷惑だけど、それが問題かというと
大半はそうでもないんでない?スマホアプリほど表示サイズにシビアでもないだろうし。

346:デフォルトの名無しさん
19/05/06 00:09:47.64 6izbbc1p.net
>>341
Excel書類とかメッチャシビアじゃん
業務アプリ系もヤバいと思うよ

347:デフォルトの名無しさん
19/05/06 00:27:47.76 Y5VmjYQ0.net
印刷フォームのレイアウトが崩れたりとかはあるかな。
ただまぁ、印刷用フォントにUI Gothic使ってたりしたらそれ自体バグと言っていいかもしれない。

348:デフォルトの名無しさん
19/05/06 19:57:45.87 o0+2Jvom.net
Excelの罫線で帳票造って印刷してるところは阿鼻叫喚だなω

349:デフォルトの名無しさん
19/05/06 20:29:59.74 Ao47xCvU.net
なんだかな感がありつつもさすがに影響でかいから修正すると思うけど、
ユーザー側が最新に合わせて調整し終えたところで修正が入って再阿鼻叫喚ありそう

350:デフォルトの名無しさん
19/05/06 23:24:02.94 w/vwmWEJ.net
そもそもExcelの印刷機能はプリンタが変わっただけで文字切れする

351:デフォルトの名無しさん
19/05/06 23:43:52.79 lqbkXOHI.net
レイアウトが崩れても見なくなる部分がなければ最悪なんとかなるけど
切れて見えなくなる部分で影響が有ると嫌だな
自分は余裕を持たせる事が多いけど
やたらピッタリにしろ
っていう圧力が強いんだよなぁ

352:デフォルトの名無しさん
19/05/07 02:19:33.96 GL9QN5WP.net
知らないんだけどExcelってフォント埋め込みできないの?

353:デフォルトの名無しさん
19/05/07 11:57:21.14 33OoCrhk.net
WYSIWYG ってどこ行ったん

354:デフォルトの名無しさん
19/05/08 12:24:09.58 edc8315b.net
The Unicode Blog: Unicode Version 12.1 released in support of the Reiwa Era
URLリンク(blog.unicode.org)
The Unicode Blog: Unicode コンソーシアムは「令和」をサポートする Unicode 12.1 を正式リリースしました
URLリンク(blog.unicode.org)
Unicode 12.1.0
URLリンク(www.unicode.org)
Unicode 12.1.0キター

355:デフォルトの名無しさん
19/05/08 12:34:08.70 EI+Yt2nX.net
令和は入れて金正恩は入れないのはダブスタじゃないんですか

356:デフォルトの名無しさん
19/05/08 14:17:35.02 Y9Xu92ZN.net
そちらの事情詳しくないんだけど最新版ではじょんうんもコード振られてるの?

357:デフォルトの名無しさん
19/05/08 16:59:08.16 hW7QTTE+.net
2011年に改訂されて三代目の文字が追加されたと言われているな。
去年L2に文書が出てた。
URLリンク(www.unicode.org)

358:デフォルトの名無しさん
19/05/08 17:50:08.89 +GcC1zVN.net
いきなり?で草
外に向けて公式発表とかはしてないのか

359:デフォルトの名無しさん
19/05/08 19:23:31.67 D1yI4PRN.net
令和の合字(U+32FF)は結局シフトJIS環境では使えないし、
まだこれを含むフォントがインストールされてなく表示出来ない事がある環境依存文字だから使うなとか
そもそも互換文字だから使うな、「令」(U+4EE4)と「和」(U+548C)を並べて書けとか言われるんやろ

360:デフォルトの名無しさん
19/05/08 23:41:31.32 g6pGEhqR.net
どうせ、利用するフォントによって、どの文字まで表示できるか?決まるんだから
変な文字は使わず、90年までの規格で止めとくほうが正解かもね。

361:デフォルトの名無しさん
19/05/09 12:49:52.00 MGsavNMK.net
今回はそういう話じゃないぞ

362:デフォルトの名無しさん
19/05/09 23:57:50.74 2Upif9A1.net
令和組み文字はCP932には入れないようだが、
JISX0213には入れるのだろうか?

363:デフォルトの名無しさん
19/05/10 00:24:53.97 jEyv0NCa.net
つーかそろそろ日本工業規格も令和に対応すべきだと思うのだが。
JIX X 0213だけじゃなくてJIS X 0301とかも。

364:デフォルトの名無しさん
19/05/10 08:46:20.50 ObISzXw3.net
CP932に追加は無いだろうけど最近の過去互換の軽視ぷりからするとやらかす可能性が完全0じゃないのが怖い

365:デフォルトの名無しさん
19/05/10 10:21:33.96 6UVTgwma.net
半角カタカナも滅べば良いし
年号の合字も無限に増やすのは無理だから
常に二文字表記で文字幅で調整すれば良い
天皇陛下万歳
千代に八千代に

366:デフォルトの名無しさん
19/05/10 14:53:16.98 CKiiAb8j.net
Android Qに絵文字64種類が追加。うち53種類が男女区別あいまいな人物のデザイン
URLリンク(japanese.engadget.com)

367:デフォルトの名無しさん
19/05/10 18:18:29.29 mVkH2fqp.net
das emoji

368:デフォルトの名無しさん
19/05/11 22:48:01.24 +ReHs7Ms.net
絵文字とかと同じ 令[ZWJ]和 でいいのにな
専用の文字コードが必要なのかと

369:デフォルトの名無しさん
19/05/12 01:19:24.51 ki3sPmcj.net
漢字のジョイントって意図が不明瞭にならないか?
偏旁に配置した新字を創字したいのかなと思ってしまう

370:デフォルトの名無しさん
19/05/12 13:36:08.25 VATOmp33.net
ほとんど見掛けないけど漢字位置記述文字みたいなの使えば?

371:デフォルトの名無しさん
19/05/12 16:00:08.02 Pj0ORKPL.net
あれは人間への説明用であって合成して表示させるものじゃないから違うような
> the reader can then create a mental picture of the ideographs from the description.
> In particular, support for the characters in the Ideographic Description block does not require the rendering engine to recreate the graphic appearance of the described character.

372:デフォルトの名無しさん
19/05/12 19:33:59.77 VATOmp33.net
あ,そうなのか。
あれを適切に設定すれば,対応したビューアで自由に漢字が表現できるもんだとばかり……。
教えてくれてありがとう。

373:デフォルトの名無しさん
19/05/12 21:21:35.48 3Fo18FOg.net
あれだと縦書きと横書きで並び変えられないしね
欲しいのは組み文字ジョインター
キ[KMJ]ジ[KMJ]マア[KMJ]パ[KMJ]ー[KMJ]ト
これで
キジアパ
マ ート
マキ
 ジ
│ア
トパ
をつくりたい

374:デフォルトの名無しさん
19/05/12 21:26:39.48 C+tli6s4.net
ジョインター?
ジョイナーでは?w

375:デフォルトの名無しさん
19/05/12 22:42:17.83 7HEr7+9q.net
ジョイナス

376:デフォルトの名無しさん
19/05/13 13:30:46.64 Dlu9US9y.net
女医
茄子

377:デフォルトの名無しさん
19/05/13 14:31:34.73 iR6Bb+jK.net
へへ
のの

へじ

378:デフォルトの名無しさん
19/05/14 01:37:14.88 M5HaQ5Df.net
>>369
そういうのは「文字」じゃなくてCSSとかで実装すればいいじゃん
……って思っちゃうなw

379:デフォルトの名無しさん
19/05/14 03:18:02.18 j93RjJXe.net
でも令和合字入れちゃったからなあ
先行規格がない生まれながらの互換文字ってかわいそうじゃない?

380:デフォルトの名無しさん
19/05/14 11:34:15.69 HHew+yI/.net
同じ失敗を繰り返すタイプ
数百年先を見通せない政策

381:デフォルトの名無しさん
19/05/14 11:58:39.59 ThbRtqnv.net
理論上は文字コードを無限に増やせる仕様じゃないとダメでしょ。

382:デフォルトの名無しさん
19/05/14 13:44:33.88 bepTC+/0.net
次の次で途絶えそうだし大丈夫じゃね?

383:デフォルトの名無しさん
19/05/14 17:50:04.82 kz8JbfNJ.net
はい、不敬罪。

384:デフォルトの名無しさん
19/05/14 19:19:08.26 ThbRtqnv.net
不経済

385:デフォルトの名無しさん
19/05/15 08:08:31.21 cTm8l9eF.net
不敬罪ではないでしょうw
実際女子しか生まれていない皇家も有るし
何らかの対策をしないと途絶える可能性は有るよ
継続させたいなら
本気で対策しないと拙いよ実際

386:デフォルトの名無しさん
19/05/15 08:35:40.27 nWHAKFhQ.net
>>345
今日の定例アップデートで修正入ったみたい

387:デフォルトの名無しさん
19/05/15 08:43:30.54 n5xZGXi9.net
だから今のうちに隠し子を作っておけと
結婚してから外で子供を作るのは嫁の人権上まずいけど
若気の至りなら仕方が無いだろう

388:デフォルトの名無しさん
19/05/15 08:48:22.54 GDL/z8kb.net
>>381
現実ではともかく
ネットの「不敬罪」はほぼネタだと思ったほうがいい

389:デフォルトの名無しさん
19/05/15 12:28:24.15 Pf7Y4ylf.net
ほとんど報道されないけどたまに逮捕されてるよな
>>378御愁傷様

390:デフォルトの名無しさん
19/05/15 12:44:57.00 n5xZGXi9.net
アホがいる

391:デフォルトの名無しさん
19/05/15 12:53:44.49 DmEZFbwt.net
地球外知的生命体との遭遇を前提に、拡張性を確保しとかないとね。

392:デフォルトの名無しさん
19/05/15 13:14:54.94 dq2v0yjU.net
僕の肛門も拡張されそうです!

393:デフォルトの名無しさん
19/05/18 16:38:38.85 F01l0NEI.net
質問
URLリンク(www.unicode.org)
X0212補助漢字とUnicodeの変換テーブルは↑で良いのでしょうか?
補助漢字には詳しくなくobsolete下にあるのでこれでよいのかよくわかりません。

394:デフォルトの名無しさん
19/05/20 22:06:47.10 WPLI0l6z.net
Consortiumが提供しているのはそれくらいかと

395:デフォルトの名無しさん
19/05/20 23:48:08.42 8Vf/KPej.net
0x2237 0x007E # TILDE
これはやめた方がいいんじゃないかな…
後はまあ

396:デフォルトの名無しさん
19/05/21 18:21:29.99 wbjhm+VX.net
>>391
全角チルダ問題ですか?

397:デフォルトの名無しさん
19/05/21 18:56:30.38 1e7kqOhQ.net
チルダは主要フォントは同じ字形になっちゃったから、
ユニコードNGの環境で初めて気づくことも多いんだよね

398:デフォルトの名無しさん
19/05/21 20:48:03.29 Qf+frYPs.net
めんどいなあ

399:デフォルトの名無しさん
19/05/30 21:05:37.63 QqsVAtGz.net
Apple、算盤の絵文字がおかしいと批判される
URLリンク(idle.srad.jp)

400:デフォルトの名無しさん
19/05/31 06:42:14.69 RBuyAv83.net
そろばんはどうでもいいが
チーズの位置は許せない

401:デフォルトの名無しさん
19/05/31 17:25:05.59 mv11bAX3.net
つうか誰が何の目的で入れたんだよ
絵文字増やすことが目的になってるだろもう

402:デフォルトの名無しさん
19/06/02 16:33:02.27 DEukDi4F.net
だってこれまで一般人からは存在も意識されてなかった文字コードの改訂が
「今年の新絵文字発表」化してから急に世界中の注目を浴びる一大イベントになったんだもん
そら浮かれるよ

403:デフォルトの名無しさん
19/06/02 20:25:46.71 A9OZ+7QR.net
鼻濁音を表す仮名か゜、き゜、く゜、け゜、こ゜、カ゜、キ゜、ク゜、ケ゜、コ゜は
JIS X 0213ではそれぞれ1文字としてコードが割り当てられたのに、Unicodeでは
半濁点なしの仮名と半濁点の2文字で表さなければいけない。Unicodeにも1文字として
収録してもらいたい。
辞書に使われる記号 [名]、[形]、(単)、(複) など ([ ]は角丸正方形、( )は丸囲み文字) も
欲しい。

404:デフォルトの名無しさん
19/06/02 20:47:27.41 SX5hebJf.net
>>399
鼻濁音はUnicodeにちゃんと提案したら通りそう。
辞書で使われる記号は外字や私的領域に配置するしかないんじゃないかな。

405:デフォルトの名無しさん
19/06/02 20:57:42.19 gW1x1cZy.net
NHKの情報番組によると、最近スマホに移行した役者の役所広司さんはガラケーの絵文字が好きでスマホの絵文字が不満らしい。

406:デフォルトの名無しさん
19/06/02 21:05:37.93 A9OZ+7QR.net
>>400
テレビ番組表で使われる記号[字]、[ニ]、[多]、[声]、[吹]、[演]など ([ ]は正方形囲み文字) は
Enclosed Ideographic Supplement (U+1F2xx) として収録されたから、同じブロックの
空き領域に辞書用の記号も追加してもらいたい。

407:デフォルトの名無しさん
19/06/02 21:16:20.35 GqRagKZH.net
よくわからん
合成文字ではいけない理由って今時ある?

408:デフォルトの名無しさん
19/06/02 21:22:49.71 gW1x1cZy.net
池江 璃花子さんのツイート
URLリンク(twitter.com)
 ポップコーンが美味しかった。
 美味しいチャーハン食べたい。
 チーズドックもマックのポテトも食べたい…🍟
 美味しいお寿司🍣アボカド🥑
 と、からみチキン
 食べたいものと行きたいとこが多すぎる🐭🏰
(deleted an unsolicited ad)

409:デフォルトの名無しさん
19/06/03 12:00:01.49 ZJy6OnVg.net
絵文字専用スレの分離独立を提案します

410:デフォルトの名無しさん
19/06/03 12:14:25.26 C5QZ8dlg.net
それはよくない

411:デフォルトの名無しさん
19/06/03 17:14:50.77 9GoUaP2A.net
さもる。とは?

412:デフォルトの名無しさん
19/06/03 18:10:06.92 waosREqi.net
この板に絵文字スレを別に作るのはいい案だとは思えない。一緒に扱ったほうがいい。
他の、スマホ系やネット文化系の板で絵文字スレを立てるのはそっちの文脈での必要に応じてやればいいが。

413:デフォルトの名無しさん
19/06/04 04:29:34.76 34q0LBOl.net
板的には絵文字禁止で

414:デフォルトの名無しさん
19/06/04 09:25:30.78 mdhyHdfA.net
絵文字はただのコードポイントだからなあ

415:デフォルトの名無しさん
19/06/04 10:53:27.04 uvNmGZET.net
このスレが絵文字の話題で埋まるのは勘弁

416:デフォルトの名無しさん
19/06/04 11:53:04.76 mdhyHdfA.net
これまでのところ埋まってないぞ

417:デフォルトの名無しさん
19/06/04 20:23:40.45 gwjuh1zM.net
>>403
それを言ったら、漢字も合字で構わなくないか? 1文字ずつコードを割り当てずに、
パーツ(部首など)に分解し、パーツと配置方法をコードで指定するIDS方式にする。
ハングルも音素に分解する。そうすれば、CJKが占めていた膨大なコード領域が
明け渡され、Unicodeを16ビットに戻せる。非CJK圏の人々はそれを望んでいそう。
漢字は情報伝達効率がとても良くて、字 2バイトで character 18バイトと同等の
情報を伝達できる。IDS上下, ウ冠, 子 の6バイトで表しても、18バイトの3分の1しか
まだない。

418:デフォルトの名無しさん
19/06/04 20:34:02.28 XXr8i2SB.net
shit



419: そうか?



420:デフォルトの名無しさん
19/06/04 20:35:22.41 XXr8i2SB.net
バイトでいうならそうか…
画数で無駄だなぁって思っちゃった

421:デフォルトの名無しさん
19/06/04 22:15:09.20 S8UlmLic.net
>>413
それを言ったら、がよくわからんが
現状で漢字は個別、>>399の仮名は合成で表現する仕組みになってるもんをそれぞれわざわざややこしくするメリットある?
あと今更ひっくり返して形だけ16bitとか言語圏関係なく望んでないと思う

422:デフォルトの名無しさん
19/06/04 23:31:18.83 sg371bFW.net
>>399で書かれてる辞書で使われるような丸囲みとか四角囲みはU+20DDやU+20DEと組み合わせて表せばいい。
例えば[名]はU+540D U+20DE、(単)はU+5358 U20DDで表せる。

423:デフォルトの名無しさん
19/06/05 21:51:36.51 uJguGtrO.net
>>413
俺もそういうのがいいとは思うけど
同じ手偏でも幅が微妙に違ったりするじゃん。
そういうのって計算というより正直 美的感覚に基づくものだから,
結局 一字一字に「手偏の幅」とかいったパラメータを与える必要が出てきそう。

424:デフォルトの名無しさん
19/06/05 22:43:55.33 U4lYdkMb.net
>>413
字形まで自動合成する必要はないだろ。字形は1字ずつデザインするが、それを呼び出すのに
IDSコードを使うだけ。

425:デフォルトの名無しさん
19/06/06 11:04:53.81 NifDLxm9.net
>>419
418だがそれはいいね。

426:デフォルトの名無しさん
19/06/06 13:09:21.77 V+RhrtBc.net
正直IPAmjにだけ入ってるクラスの漢字見てるとこれIDSでどうすんのって思うよ。今更どうしようもないと思う。

427:蟻人間
19/06/06 13:32:02.81 8KYXjatA.net
台湾に漢字の部首を組み合わせてフォントを合成する技術があるらしい。

428:デフォルトの名無しさん
19/06/06 19:13:54.79 NifDLxm9.net
>>422
それってソフトウェアやライブラリとして提供されてたりする?
もしよければ教えてほしい

429:蟻人間
19/06/06 19:56:27.90 W0KBfnTD.net
URLリンク(www.dynacw.co.jp)
これ。

430:デフォルトの名無しさん
19/06/06 23:21:56.20 mU5eCwwC.net
技術も何もメイリオあたりもそういうのじゃなかったっけ
結局調整が必要になるっぽいけど

431:デフォルトの名無しさん
19/06/07 08:07:16.78 rFfmCjQx.net
なんか思ってた技術と違うわ。
IDSの組合せをそれが表現する漢字と対応させるんかと思ってた。

432:デフォルトの名無しさん
19/06/07 11:40:10.92 nJu+ZeI9.net
糸冬


433:デフォルトの名無しさん
19/06/09 18:38:42.78 +hAUN3Ld.net
漢字構成記述文字列って複数の記述文字の組み合わせとそもそもの複数の文字とをどうやって区別するんだろう。
「⿰山⿱上下」という並びが「峠」を意味するのか「山𠧗」を意味するのか区別できなくね?

434:デフォルトの名無しさん
19/06/09 20:33:00.79 SSgQq8CW.net
頻出度?

435:デフォルトの名無しさん
19/06/09 22:49:36.82 lml609nH.net
1文字になる以外の解釈が可能な定義にはなってないように見えるが

436:デフォルトの名無しさん
19/06/10 00:45:55.32 /7QyuKh+.net
というかもともとそういうもんじゃない?
あれは人間が読むことを前提にした文中で説明を簡素にするために使う記号であって
合成とか機械処理とかをやることははなから考えてないと思う。

437:デフォルトの名無しさん
19/06/10 11:07:15.11 g6tidy/F.net
⿰山⿱上下 → 山𠧗
⿰⿱山上下 → 峠

438:デフォルトの名無しさん
19/06/10 11:10:17.22 g6tidy/F.net
違うな
>>430 が正しい
⿰山⿱上下 → 峠 (正しい)
⿰山⿱上下 → 山𠧗 (不正)
山⿱上下 → 山𠧗 (正しい)
⿰⿱山上下 → 峠 (知らんがな)

439:デフォルトの名無しさん
19/06/10 11:14:02.36 DwfAnHcn.net
>>433
最後のは不正では。
⿰⿱山上下なら
↓こんな文字になっちゃう
URLリンク(o.8ch.net)

440:デフォルトの名無しさん
19/06/10 13:25:56.68 ujTvUCPf.net
カッコなしで誤解釈の余地なくやるにはRPNにすればよいのでは?

441:デフォルトの名無しさん
19/06/10 14:05:24.64 DwfAnHcn.net
括弧なしでも漢字構成記述文字列は一意に定まるぞ。
曖昧さの余地はない筈。

442:デフォルトの名無しさん
19/06/10 14:06:48.56 DwfAnHcn.net
ていうかそもそも漢字構成記述文字列自体がポーランド記法っぽい性格を持ってる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434みたいな字形になる。

443:デフォルトの名無しさん
19/06/10 14:17:40.77 g6tidy/F.net
同じ文字を二通り以上の表現方法があるのはセキュリティ上やばいと爺さんが言ってた
UTF-8みたいなやつ

444:デフォルトの名無しさん
19/06/10 14:19:52.70 g6tidy/F.net
例えば
⿰男⿰女男

⿰⿰男女男

445:デフォルトの名無しさん
19/06/10 14:43:12.52 VjrzvIQA.net
男女 男
右端は俺orz

446:デフォルトの名無しさん
19/06/10 14:45:35.90 AYc4wpPC.net
全然関係ないが男女男男女女男女男女を思い出した。おっさんだな、俺。

447:デフォルトの名無しさん
19/06/10 14:55:32.08 DwfAnHcn.net
>>439
嬲は「⿲男女男」じゃないの?

448:デフォルトの名無しさん
19/06/10 14:56:33.42 g6tidy/F.net
だから複数あるっていう意味で書いたんだが
正規化で一つにっていうのは判る

449:デフォルトの名無しさん
19/06/10 20:42:06.03 QC59E/Dz.net
表現意図としては比が2:1:1と1:1:2と1:1:1で違いがあるような

450:デフォルトの名無しさん
19/06/10 23:11:41.70 rO86gbFX.net
>>399-400
鼻濁音付き仮名文字は日本NBから提案したけど蹴られて今の姿になった。
URLリンク(std.dkuug.dk)
仮名文字に限らずシーケンスで表現可能な文字に単体の文字コードを割り振ってもらうのは
相当説得力のある理由が要る。
逆に辞書用の記号は提案書を出せば通る可能性ありそう。

451:デフォルトの名無しさん
19/06/11 01:59:35.04 SK3ydrDR.net
ぽげむたは?

452:デフォルトの名無しさん
19/06/11 04:13:44.44 Yb3f0IhW.net
>>443
いや、>>444も言っている通り嬲は「⿲男女男」以外で表わせないと思うよ。

453:デフォルトの名無しさん
19/06/11 08:44:46.66 GW+sQhXS.net
将棋好きのおいらとしては、ひっくり返った「玉」「飛」「歩」とかも
登録してほしいと思うのだが。

454:デフォルトの名無しさん
19/06/11 10:41:29.12 Yb3f0IhW.net
>>448
Unicodeってそもそも将棋の駒 全部登録されてないんじゃ?

455:デフォルトの名無しさん
19/06/11 11:48:29.98 9Qw6sZwd.net
笑→ケケ夭
とか
禁→木木示
とか
哭→口口犬
とか

畿→糸糸田戈
は同じ表現?

456:デフォルトの名無しさん
19/06/11 12:18:11.06 Yb3f0IhW.net
>>450
まあ機械処理向けの言語じゃないから
人が「分解できる」と思うかどうかだよね
ちなみに「畿」の部首って「田」なんだな。すげー意外。

457:デフォルトの名無しさん
19/06/11 12:35:42.68 GW+sQhXS.net
>>449
ないよ。黒塗り五角形と白ヌキ五角形だけ。

458:デフォルトの名無しさん
19/06/11 14:57:42.64 Y18rXsQw.net
文字表現ってことで
●●構えっていうと門しか思い出せないし
●●囲いっていうと口しか思い出せないけど
将棋の駒の白抜き五角形は囲いなんだろうか

459:デフォルトの名無しさん
19/06/11 17:55:27.24 Yb3f0IhW.net
いっそのことCombining Diacritical Marks for Symbolsあたりに将棋の駒の枠線を登録してもらえればいい

460:デフォルトの名無しさん
19/06/12 00:03:22.24 82Q6hISi.net
>>424
そこ日本の会社

461:デフォルトの名無しさん
19/06/12 01:16:49.13 ynCJAfYS.net
>>454
枠線の中に複数文字入れるのどうするとか
中に「と」みたいなのを表示したい場合それは本当に「と」で表現するのかとかいろいろややこしくなりそう
将棋みたいに中身が決まってるやつは一通り個別に並べてもらったほうがシンプルじゃないのかな…

462:デフォルトの名無しさん
19/06/12 01:57:37.00 qj/fM2VI.net
URLリンク(www.unicode.org)
逆さのまではなくてもいいと思うがなあ

463:デフォルトの名無しさん
19/06/12 07:01:32.61 XwhNnAHz.net
あ、すでに議論の対象にはなってるのか。

464:デフォルトの名無しさん
19/06/12 08:39:27.70 QJXYMRLU.net
>>453
黒と白で、先手と後手を表しているだけだよ。

465:デフォルトの名無しさん
19/06/12 09:02:03.43 om/mzkP2.net
文章中に書くなら白黒五角形で十分だと思うが、なんで盤面まで表現したがるかな。

466:デフォルトの名無しさん
19/06/12 11:21:19.79 tqvE0DW+.net
歩の裏の「と」があるべき位置に
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?

467:デフォルトの名無しさん
19/06/12 12:54:03.65 QJXYMRLU.net

三 みたいなやつ?
全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。

468:デフォルトの名無しさん
19/06/12 13:18:58.92 tqvE0DW+.net
Tも三も金なんですね

469:デフォルトの名無しさん
19/06/12 17:24:29.90 XwhNnAHz.net
どうでもいいけどそのレスを見て
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない

470:デフォルトの名無しさん
19/06/12 17:54:37.18 o59LDmQW.net
歩兵の裏は金と同じ読みの今(きん)の崩し字をあてたので
「と」と極めて似た文字になったという説がある

471:デフォルトの名無しさん
19/06/12 23:56:15.89 4S3+zhe0.net
T


なんでこれで金になるのかさっぱり判らん
URLリンク(blogimg.goo.ne.jp)
あと
|
とか

とか
謎のが多すぎ

472:デフォルトの名無しさん
19/06/13 01:03:53.78 WD6Kvaf7.net
崩し字はむずかしうてわからん

473:デフォルトの名無しさん
19/06/13 01:05:01.31 WD6Kvaf7.net
崩し字というかバラし字?

474:デフォルトの名無しさん
19/06/13 01:11:22.08 uH0MzXQS.net
>>457
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
URLリンク(www.unicode.org) のe.5
で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.
インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。

475:デフォルトの名無しさん
19/06/13 01:32:11.84 domb7+if.net
なるほどなあ。
チェストーはインラインで使ったりするもんなんだろうか

476:デフォルトの名無しさん
19/06/13 06:29:39.15 IV8IxRGq.net
日本NBが後押しすれば10646に入りそうな気がするけどね
漢字以外は興味持たないだろうって見透かされてるんだろうな

477:デフォルトの名無しさん
19/06/14 11:32:49.03 BMAIfRwQ.net
まあ言いたかないけど 欧米が制定した企画だからね……。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。

478:デフォルトの名無しさん
19/06/14 12:45:36.88 AVMOMmmV.net
URLリンク(nixeneko.hatenablog.com)
モンゴル文字のことはよくわからんが、ここに書いてあることによると、
> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。
> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。
ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。

479:デフォルトの名無しさん
19/06/14 12:54:39.24 AVMOMmmV.net
ただ、似たようなものは英文にもあるわけで、fish や office のように、
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。
しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。

480:デフォルトの名無しさん
19/06/14 13:00:53.97 AVMOMmmV.net
ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。

481:デフォルトの名無しさん
19/06/14 21:13:23.45 bakZpKUF.net
ガチャーン合体!

482:デフォルトの名無しさん
19/06/15 12:06:26.17 s4HbSmAb.net
>>466
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。

483:デフォルトの名無しさん
19/06/15 21:00:26.68 dgVxOSWc.net
わけわからんまで崩していくのは日本独特?

484:デフォルトの名無しさん
19/06/16 11:45:02.01 NdAq/MEw.net
これもなんで金になるのか判らんやつ

でいいのに
URLリンク(encrypted-tbn0.gstatic.com)

485:デフォルトの名無しさん
19/06/16 13:03:35.22 8f8EXiHl.net
木天火土水で6人目のゴールドは光です・・・

486:デフォルトの名無しさん
19/06/16 17:16:00.47 UaT4ATnR.net
>>479-480
わらったw

487:デフォルトの名無しさん
19/06/18 06:18:41.06 3nOE2mBA.net
プログラム板にキチガイ降臨中!botに一晩も反応する異常さ
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
スレリンク(tech板)
142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。

488:デフォルトの名無しさん
19/06/22 01:57:21.14 t+lz7b+S.net
>>482
釣られて そのスレ見に行ったけど
寧ろそのa4っていう小手の人が被害に遭ってるように思えたけどな

489:デフォルトの名無しさん
19/06/25 03:50:40.53 wcrPNuwW.net
ヲシテ文字って使えないの?

490:デフォルトの名無しさん
19/06/25 05:40:01.35 DXMPLOPq.net
Unicode協会が配布してるプログラムでシェルスクリプトでUTF-8文字列を扱えるデータってないかな。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。

491:デフォルトの名無しさん
19/06/25 06:09:39.19 1JIWmrxD.net
にほんごでおk

492:デフォルトの名無しさん
19/06/25 06:42:32.78 DXMPLOPq.net
CLDR for shellみたいなのがないかなと。

493:デフォルトの名無しさん
19/06/25 13:49:53.45 takEpFxW.net
Unicode協会って書かれると、アグネスがやってるパチモンに見えてくる

494:デフォルトの名無しさん
19/06/28 22:59:11.92 NkHCwivq.net
使えないよ
その手の文字が登録されたことはあるのかな

495:デフォルトの名無しさん
19/06/29 01:02:31.02 P81PdZpf.net
Dohentaiyagana

496:デフォルトの名無しさん
19/06/29 01:49:55.29 LWdOpl9S.net
神代VSでまとめてしまおう

497:デフォルトの名無しさん
19/06/29 02:20:12.41 g9Pe6ky6.net
最近Kenのツイートが酷い
LunaticとかAdobe的にいいのか

498:デフォルトの名無しさん
19/06/30 02:04:42.75 1ALBmyOB.net
絵文字をリガチャとして実装するという話を聞いたことがあるが
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。

499:デフォルトの名無しさん
19/06/30 02:44:42.35 KxegnpZe.net
絵文字ガチャに見えた

500:デフォルトの名無しさん
19/06/30 18:46:20.88 1ALBmyOB.net
URLリンク(symbolset.com)
これとか。素晴しい発想だと思いませんこと?(お嬢様風)

501:デフォルトの名無しさん
19/06/30 19:55:14.68 VWoLS78P.net
全然

502:デフォルトの名無しさん
19/06/30 20:32:53.74 MkBgWLvD.net
見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう

503:デフォルトの名無しさん
19/06/30 21:02:05.57 1ALBmyOB.net
>>497
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。

504:デフォルトの名無しさん
19/06/30 21:31:19.26 2juPiYlp.net
なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?

505:デフォルトの名無しさん
19/06/30 22:16:35.89 MkBgWLvD.net
>>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。
入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし

506:デフォルトの名無しさん
19/06/30 23:23:56.67 sPnkqdOZ.net
どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい

507:デフォルトの名無しさん
19/07/01 00:12:01.52 vOsPyG+v.net
This is a pen��.とか[�� Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a ��guin.の誤爆避けも必要になる。

508:デフォルトの名無しさん
19/07/01 05:12:02.84 2smzn43h.net
URLリンク(8beat-studio.net)
とか? >>499

509:デフォルトの名無しさん
19/07/01 05:12:32.89 2smzn43h.net
>>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。

510:デフォルトの名無しさん
19/07/01 05:13:03.16 2smzn43h.net
>>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。

511:デフォルトの名無しさん
19/07/01 12:02:58.02 liKrIWIO.net
SVGベタ書きがいいと思う

512:デフォルトの名無しさん
19/07/01 13:38:09.58 Ltl936Sg.net
WebフォントってDL待ちでむしろ遅いイメージしかないな…

513:デフォルトの名無しさん
19/07/01 16:21:02.28 MoEwNeEz.net
日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…

514:デフォルトの名無しさん
19/07/01 19:16:16.83 2smzn43h.net
>>507
>>508
絵文字リガチャフォントだと高々100個くらいだから
日本語Webフォントの常識は当て嵌らんぞ

515:デフォルトの名無しさん
19/07/01 21:01:31.88 1h0unusf.net
推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。

516:デフォルトの名無しさん
19/07/04 14:48:01.78 nXaEmuLe.net
ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
URLリンク(www.iso.org)
いつの間にか完成していた。

517:デフォルトの名無しさん
19/07/05 07:31:35.09 CMdnJVDV.net
JISにも取り込まれるかな?

518:デフォルトの名無しさん
19/07/12 14:32:58.64 q8HbeEfz.net
>>97
BCってなに?

519:デフォルトの名無しさん
19/07/12 23:51:11.25 aHiS7zOG.net
ブラックキャップ

520:デフォルトの名無しさん
19/07/13 19:08:40.33 Wy302ne8.net
まじめに答えてほしかった。。。

521:デフォルトの名無しさん
19/07/13 20:43:48.97 tESkaNg7.net
����?

522:デフォルトの名無しさん
19/07/13 22:47:35.97 0DH1k/wL.net
>>516
何これ?

523:デフォルトの名無しさん
19/07/14 01:25:41.28 cxt0+A+5.net
ブラックキャップ

524:デフォルトの名無しさん
19/07/14 09:54:29.74 N6Jg+9Qo.net
ワロタ

525:デフォルトの名無しさん
19/07/14 22:04:02.29 GSQZGuhE.net
>>513
>>97じゃないから確かなことは言えないけど
「better choice」じゃないかな?
つまり絵文字を「入れざるを得ない」ってことね。

526:デフォルトの名無しさん
19/07/15 03:44:17.27 GN7I2Kmp.net
単に後方互換だろ…

527:デフォルトの名無しさん
19/07/15 04:14:22.81 GXO+LVjR.net
BA-90使いたいのに斑の黄顔になるのはなんだかなー

528:デフォルトの名無しさん
19/07/16 23:08:05.64 6ZdisLnD.net
IC: 相互互換性
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた

529:デフォルトの名無しさん
19/07/17 11:56:39.82 FD/sfaX1.net
LeftとかRightとかCorrectは無いんか

530:デフォルトの名無しさん
19/07/17 16:54:36.95 Lq1+nMLH.net
>>524
correctはともかく左右は確実にねーだろw

531:デフォルトの名無しさん
19/07/18 14:33:21.11 44Ax18Yo.net
共産とりっけんと社民社と国民主と令和革命はLC互換

532:デフォルトの名無しさん
19/07/18 23:12:28.17 BkvY1rKv.net
>>526
わろたw

533:デフォルトの名無しさん
19/07/23 15:56:55.39 vatz3/hX.net
URLリンク(github.com)
↑Unicodeの基本多言語面を使ったエンコード方法w

534:デフォルトの名無しさん
19/07/23 17:04:19.76 yKl7I/yp.net
高度に発達したエンコードはMojibakeと見分けがつかない

535:デフォルトの名無しさん
19/07/24 00:37:51.21 ArGZw8p9.net
基本多言語面って制御文字含んでるよね。
それbaseXXの�


536:{来の意味を成してないw



537:デフォルトの名無しさん
19/08/18 16:07:01.10 zqR8kD3Y.net
W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
URLリンク(www.w3.org)

538:デフォルトの名無しさん
19/08/18 17:27:15.46 wpOWgZAQ.net
読めるけど...?

539:デフォルトの名無しさん
19/08/18 23:04:31.46 8LEpKI7v.net
ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ

540:デフォルトの名無しさん
19/08/19 01:20:35.42 JKQq3Dbg.net
(´・・∀・・`)ほう

541:デフォルトの名無しさん
19/08/19 06:07:28.33 xlQPwL5+.net
>>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。
最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。

542:デフォルトの名無しさん
19/08/19 07:31:42.15 SJok1opV.net
>>535
Firefox68には文字コード指定が残ってる
通常は無効になってるけど>>531のリンク先を表示したときは有効になって
ISO-2022-JPを指定すると文字化けなしで読めた

543:デフォルトの名無しさん
19/08/19 08:38:57.28 xlQPwL5+.net
ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?

544:デフォルトの名無しさん
19/08/20 11:37:07.61 zlJnj2O9.net
>>531
これはひどいω

545:デフォルトの名無しさん
19/08/20 11:39:07.12 zlJnj2O9.net
>>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ

546:デフォルトの名無しさん
19/08/20 18:30:12.77 Gkd3xMH4.net
なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
スレリンク(tech板:821番)-843

547:デフォルトの名無しさん
19/08/20 21:44:07.86 Y189B2BT.net
HTMLをiso-2022-jpにするのって
どこの文化なんだろうか?
Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?
iso-2022-jpはメールにしか使われてなかったはずだが

548:デフォルトの名無しさん
19/08/20 21:47:57.43 UVunetX1.net
>>531
イシカワ マサヤスというのは誰だろうね。

549:デフォルトの名無しさん
19/08/20 21:51:25.41 Y189B2BT.net
イシカワ マサヤスさんでは?

550:デフォルトの名無しさん
19/08/20 21:52:36.86 UVunetX1.net
石川雅康と石川哲志は親族だろうか?
どちらもICT業界から去ったのかな。

551:デフォルトの名無しさん
19/08/20 21:54:13.55 Y189B2BT.net
またつまらんものを

552:デフォルトの名無しさん
19/08/20 21:58:33.22 UVunetX1.net
XHTMLが終わってしまって、そのまま放置の石川さん。

553:デフォルトの名無しさん
19/08/20 22:46:49.05 anpoimU7.net
>>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
URLリンク(www.tohoho-web.com)

554:デフォルトの名無しさん
19/08/20 23:01:02.75 UVunetX1.net
>>547
http://の先頭のhを取っても付けても同じですよ。

555:デフォルトの名無しさん
19/08/20 23:43:43.88 Gkd3xMH4.net
> どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
URLリンク(web.archive.org)
えぇ……。

556:デフォルトの名無しさん
19/08/21 00:08:09.19 /FRdjxvW.net
1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。

557:デフォルトの名無しさん
19/08/21 02:35:13.27 GZen3C6t.net
>>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?
> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。

558:デフォルトの名無しさん
19/08/21 03:44:23.93 jDiMObB6.net
>>540
流れは似てるが今回は指摘されてるURLが問題なんだろ
よりによってアイツがってやつさ

559:551
19/08/21 05:07:33.18 GZen3C6t.net
あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か
sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?
URLリンク(www.w3.org)

560:デフォルトの名無しさん
19/08/21 14:49:37.63 ur92HW83.net
拡張子付け間違いか

561:デフォルトの名無しさん
19/08/22 06:16:14.71 mlpPC2JR.net
ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。

562:デフォルトの名無しさん
19/08/22 06:36:57.94 jM8tCXZ0.net
だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば
iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話

563:デフォルトの名無しさん
19/08/22 08:04:31.58 jlFkmCtz.net
jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで

564:デフォルトの名無しさん
19/08/22 09:50:35.92 xQsiKIbM.net
鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る

565:デフォルトの名無しさん
19/08/22 10:23:09.36 jM8tCXZ0.net
>>557
拡張子はjisじゃなくてsjisな
だからドキュメントの文字コードが明らかに間違ってるんだよ

566:デフォルトの名無しさん
19/08/22 10:30:34.86 jM8tCXZ0.net
昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。
なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった
そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。
たぶんこんなところ

567:デフォルトの名無しさん
19/08/22 10:33:49.69 8JJS2LZD.net
>>559
お前のレスの >>556 には jis って書いてあるだろω
お前が原因

568:デフォルトの名無しさん
19/08/22 10:35:00.76 jM8tCXZ0.net
>>561
単なる書き間違えじゃね?
リンク先見ればわかるでしょ

569:デフォルトの名無しさん
19/08/22 10:38:26.99 8JJS2LZD.net
>だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jis
こういうおっちょこちょいが >>531 みたいなミス連発するんだろうな

570:デフォルトの名無しさん
19/08/22 15:58:03.72 mlpPC2JR.net
皆さん落ち着いて

571:デフォルトの名無しさん
19/08/23 17:29:19.40 bWgnQwQ7.net
なんでUTF8以外違法になった今そんな話してんだか・・・

572:デフォルトの名無しさん
19/08/23 17:59:07.09 UifFOlyJ.net
× 違法 ○ 非推奨

573:デフォルトの名無しさん
19/08/24 00:05:20.43 Ka96Zrl8.net
秘宝とか緋水晶とか何の話をしてるんだ?

574:デフォルトの名無しさん
19/08/25 20:34:39.12 ++G8a3I1.net
ムーンプリズムパワー!メイクアップ!

575:デフォルトの名無しさん
19/08/25 22:05:01.03 E2o3oeEK.net
タリスマン

576:デフォルトの名無しさん
19/08/25 22:36:09.44 heTmUHGD.net
クリマタスミ

577:デフォルトの名無しさん
19/08/28 13:35:52.48 AiVdwxrR.net
ひまだ

578:デフォルトの名無しさん
19/08/28 19:19:16.62 lfvHhqTB.net
サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。

579:デフォルトの名無しさん
19/08/28 20:04:07.93 FG4A80Dg.net
じっさい32じたいそんな使わないだろw

580:デフォルトの名無しさん
19/08/29 18:28:30.40 VG5IecJ5.net
でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。

581:デフォルトの名無しさん
19/08/29 18:42:08.11 y3rrvHgi.net
読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている

582:デフォルトの名無しさん
19/08/29 18:49:00.69 1ks18uap.net
内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利
あとはcps932が滅ぶのを待つだけ

583:デフォルトの名無しさん
19/08/29 19:05:33.35 VG5IecJ5.net
OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。
でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。

584:デフォルトの名無しさん
19/08/29 19:09:37.98 CAV+1+Xc.net
という会話を何年も前にこのスレで観た

585:デフォルトの名無しさん
19/08/29 19:11:19.48 YrWceYNE.net
複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない

586:デフォルトの名無しさん
19/08/29 20:02:33.30 jljmwQsV.net
プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。

587:デフォルトの名無しさん
19/08/29 21:00:32.68 FJllEP/G.net
【名案】0~9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021-65018=3」ってどう書くの?
URLリンク(togetter.com)

588:デフォルトの名無しさん
19/08/29 22:50:02.31 azXlKn0W.net
UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
URLリンク(tech.nikkeibp.co.jp)

589:デフォルトの名無しさん
19/08/29 23:01:38.50 jljmwQsV.net
UTF-8だけで必要十分という結論に到達せざるをえない現実

590:デフォルトの名無しさん
19/08/29 23:09:19.19 azXlKn0W.net
逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、
UTF-32でも不便になったからUTF-8でいいでしょ?
どうせ単純には扱えずライブラリ使うしか無いんだから。
という必要十分な文字コードを捨てたというのが現実

591:デフォルトの名無しさん
19/08/29 23:11:55.32 jljmwQsV.net
宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。

592:デフォルトの名無しさん
19/08/30 00:11:25.73 h/StilS8.net
文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw

593:デフォルトの名無しさん
19/08/30 01:01:22.62 LpXSw35l.net
UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは

594:デフォルトの名無しさん
19/08/30 01:29:38.44 /ghu33Nb.net
>>586
ではどうぞ御説明をどうぞw

595:デフォルトの名無しさん
19/08/30 13:00:23.27 oVszNH41.net
>>579
codecvtは糞だ

596:デフォルトの名無しさん
19/08/30 13:03:12.55 oVszNH41.net
>>580
だった
まあどっちでもいいけど

597:デフォルトの名無しさん
19/08/30 15:32:59.58 6uSriybI.net
>>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。

598:デフォルトの名無しさん
19/08/30 15:56:24.57 iPGqG8dk.net
>>591
それぐらいみんな知ってる

599:デフォルトの名無しさん
19/08/30 17:05:21.42 GEn/r+mZ.net
>>592
それぐらいみんな知ってる

600:デフォルトの名無しさん
19/08/30 17:19:36.31 57FOZgRt.net
ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。

601:デフォルトの名無しさん
19/08/30 17:27:36.02 GEn/r+mZ.net
定期
貼れるんかこれ
URLリンク(qiita.com)

602:デフォルトの名無しさん
19/08/31 10:08:53.77 0iGUnrw4.net
>>591
スレの流れみた?UTF-32の話をしてんだぞ?

603:デフォルトの名無しさん
19/08/31 15:33:43.16 SHne0DDt.net
>>596
そのまえ

604:デフォルトの名無しさん
19/08/31 15:35:30.15 SHne0DDt.net
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ

605:デフォルトの名無しさん
19/08/31 15:37:04.56 3i1dPJsj.net
>>598
それは理由が書いてないから、読む価値ある?

606:デフォルトの名無しさん
19/08/31 15:45:23.47 4qIvp+ND.net
なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ

607:デフォルトの名無しさん
19/08/31 15:56:52.05 3i1dPJsj.net
ん?支持しなくて良いよ

608:デフォルトの名無しさん
19/08/31 17:12:51.44 0iGUnrw4.net
>>597
じゃあ >>586 はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句,
碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?

609:デフォルトの名無しさん
19/08/31 17:59:12.56 Yn5v13ie.net
ネットウヨw

610:デフォルトの名無しさん
19/08/31 20:21:37.85 5EL66xzp.net
re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。

611:デフォルトの名無しさん
19/08/31 22:52:53.39 0iGUnrw4.net
寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。

612:デフォルトの名無しさん
19/08/31 22:58:57.55 3i1dPJsj.net
UTF-32対応は難しいから無理だろ

613:デフォルトの名無しさん
19/09/01 01:36:48.58 sYwYgS29.net
iconv禁止

614:デフォルトの名無しさん
19/09/01 09:07:17.74 XF6G4Ohn.net
NKF(Network Kanji code conversion Filter)を使えば?
Ruby にも、NKF モジュールがある

615:デフォルトの名無しさん
19/09/01 10:46:26.40 YneNC5Ev.net
別にコード変換ツールを探してるわけじゃなくね?w

616:デフォルトの名無しさん
19/09/01 10:52:49.46 kCJZVLuH.net
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決

617:デフォルトの名無しさん
19/09/01 12:53:54.91 k0czTyLP.net
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。
UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。
UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。

618:デフォルトの名無しさん
19/09/01 13:07:58.05 lmQdJ5gb.net
>>611
いろいろ間違ってるなw
まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

619:デフォルトの名無しさん
19/09/01 13:11:25.72 xmxF7u0H.net
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。

620:デフォルトの名無しさん
19/09/01 13:35:49.57 JCPxJyAV.net
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ

621:デフォルトの名無しさん
19/09/01 13:40:59.73 kCJZVLuH.net
>>612
おまいもかなり可笑しいなω

622:デフォルトの名無しさん
19/09/01 13:42:43.07 k0czTyLP.net
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。
>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。
シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。
>UTF32が21bitコードになってしまったのはUTF-8のせいだ
UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。
>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
収録した記号は他にも色々あるし、U+F0000~U+10FFFFは外字領域だし、
21ビットだけでは心許ない。
>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。

623:デフォルトの名無しさん
19/09/01 14:01:22.04 JCPxJyAV.net
(もしかして: フォント)

624:デフォルトの名無しさん
19/09/01 14:17:44.56 Cv4S4gQH.net
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない

625:デフォルトの名無しさん
19/09/01 14:29:25.97 k0czTyLP.net
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。

626:デフォルトの名無しさん
19/09/01 14:38:49.28 5y1tL0M+.net
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ

627:デフォルトの名無しさん
19/09/01 15:12:24.21 VpClr4jS.net
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが

628:デフォルトの名無しさん
19/09/01 15:24:13.07 Cv4S4gQH.net
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www

629:デフォルトの名無しさん
19/09/02 15:56:23.21 8MncpZHQ.net
魔法(圧力)

630:デフォルトの名無しさん
19/09/02 16:24:11.77 KSSQVEnP.net
>>623
どこからの?
セブンイレブンとか?

631:デフォルトの名無しさん
19/09/02 22:33:53.67 8MncpZHQ.net
マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。

632:デフォルトの名無しさん
19/09/03 00:26:14.39 EcUF0HHf.net
そんな圧力あったかなあ

633:デフォルトの名無しさん
19/09/03 06:39:22.40 KovswbEV.net
>>625
所でLinuxもデスクトップ環境も
一つに統一したほうが良いのではないか?ん?

634:デフォルトの名無しさん
19/09/03 08:49:15.73 /ybqtULG.net
MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある
URLリンク(ja.wikipedia.org)

635:デフォルトの名無しさん
19/09/03 10:21:51.94 KovswbEV.net
PDFはアドビのプロプラフォーマットってイメージが抜けないw

636:デフォルトの名無しさん
19/09/03 10:34:53.29 gWEsYspA.net
JavaだってSunのプロプラ言語だぞ

637:667
19/09/03 12:40:23.25 JzHlK+VD.net
今は違うけどね

638:デフォルトの名無しさん
19/09/03 15:04:07.63 jfAsT/N5.net
そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる

639:デフォルトの名無しさん
19/09/03 15:40:05.81 KovswbEV.net
Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch