18/12/17 16:54:24.71 Pfqpaohb.net
■ライブラリ
IBM Globalization - ICU
URLリンク(www-306.ibm.com)
NKF32.DLL
URLリンク(www.vector.co.jp)
バベル
URLリンク(tricklib.com)
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
URLリンク(tricklib.com)
mlang
URLリンク(msdn.microsoft.com)(en-us).aspx
iconv
URLリンク(www.gnu.org)
ICU
URLリンク(www.icu-project.org)
8:デフォルトの名無しさん
18/12/17 16:55:24.40 Pfqpaohb.net
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはURLリンク(masaka.dw.land.to)とか。
9:デフォルトの名無しさん
18/12/17 16:56:24.69 Pfqpaohb.net
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
URLリンク(std.dkuug.dk)
ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
URLリンク(appsrv.cse.cuhk.edu.hk)
10:デフォルトの名無しさん
18/12/17 16:58:24.64 Pfqpaohb.net
前スレが終了間近だったので立てました。
追加するサイトなどあればよろしくお願いします。
11:デフォルトの名無しさん
18/12/17 20:17:00.51 WCs/11MM.net
文字コード総合スレ Part12
スレリンク(tech板)
12:デフォルトの名無しさん
18/12/18 10:08:11.45 xxM0ZIZ4.net
>>1
U+30B9 U+30EC U+7ACB U+3066 U+4E59
13:デフォルトの名無しさん
18/12/18 11:22:14.11 /M0/bFGF.net
>>11 の本スレ推奨
Part 13 になったら起こしてくれ
14:デフォルトの名無しさん
19/03/08 14:51:30.23 uMMKH+w1.net
一応メモ
URLリンク(qiita.com)
15:森&
19/03/09 06:47:26.73 ZOfzHyh2.net
C++17
非推奨の詳細
wstring_convert<...>
codecvt_utf8_utf16<...>
codecvt_utf8<...>
codecvt<...>
Unicodeの文字コード変換を行うこれらのクラスは、不正なコードポイントに対する
安全なエラー処理の方法を提供していなかったため、セキュリティ上の欠陥があった。
仕様もあいまいであったため、不正なコードポイントに対してどのように振る舞うかも
不明であった。
Unicode以外のShift_JISやBig5といった文字コードの利用が急激に減少している。
標準ライブラリでの現代的なUnicodeの変換機能は非常に必要とされているが、
<codecvt>とそれに関連する機能の設計はお粗末なものだった。
将来より良いものを作るために、これらの機能は非推奨とする。
標準ライブラリにUnicodeの文字コード変換をする代替機能はないため、
他の専門特化した文字コード変換のライブラリを使用すること。
URLリンク(cpprefjp.github.io)
URLリンク(ja.cppreference.com)
どれ使えばええの?
森鷗外𠮟る
16:デフォルトの名無しさん
19/03/09 07:24:12.96 h0df79AA.net
C++自体が非推奨
17:デフォルトの名無しさん
19/03/09 16:56:18.99 kfZA3URW.net
C++11の糞仕様がずっと放置されてる
本スレ消費はよ
18:デフォルトの名無しさん
19/03/10 00:54:02.53 ktyeDSUM.net
C++の次の改訂ではC++の全ての仕様が削除されるべき
19:デフォルトの名無しさん
19/03/10 17:40:35.50 uFsYqTSV.net
CJKが頑張って苦情入れたら非推奨にされましたとさ
URLリンク(twitter.com)
(deleted an unsolicited ad)
20:デフォルトの名無しさん
19/03/10 17:47:41.69 yzd/Af8M.net
リョウくんにお返事貰ってるな。
21:デフォルトの名無しさん
19/03/10 18:01:51.00 uFsYqTSV.net
非推奨というより使用禁止レベルの糞やでcodecvt
22:さまよえる蟻人間
19/03/10 18:05:00.62 eLFCjw3Q.net
URLリンク(github.com)
使ってね。
23:デフォルトの名無しさん
19/03/11 04:49:49.14 pTTv+VC9.net
本当に怖い文字コードの話
なんか貼れないので分割
heppoko.
hatenadiary.
jp/
entry/
2018/04/28/184559
24:デフォルトの名無しさん
19/03/11 08:44:07.99 u2Hto+zd.net
ツイッターで#テクノロジー犯罪と検索して、まじでやばいことを四代目澄田会の幹部がやってる
被害者に対して暴力団以外にタゲそらしをしてるがやってるのは暴力団で普段外に出ることが少ないため遊びで公共の電波と同じような電波を使って殺人をしてる
統失はほとんどが作られた病気で実際は電波によって音声送信や思考盗聴ができることが最近明らかになりつつある
警察や病院では病気としてマニュアル化されてしまっているのが現状で被害者は泣き寝入りしてる
被害者がリアルタイムで多い現状を知って、被害者間でしか本当の事だと認知できていない
実際にできると思われていない事だから、ただの幻聴ではない実際に頭の中で会話ができる
できないことだと思われているからこそ真面目に被害を訴えてる
海外でも周知されつつあることを知ってほしい。
このままだとどんどん被害が広がる一方
#テクノロジー犯罪
#四代目澄田会
25:デフォルトの名無しさん
19/03/11 13:01:21.07 qRllmJaM.net
>>218
ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ
26:デフォルトの名無しさん
19/03/11 14:24:48.05 hfHU2O5u.net
char_traits の length って信用していいの?
27:デフォルトの名無しさん
19/03/12 03:51:12.13 FSVt1tPQ.net
若干違和感ある部分も
絵文字がある種のUnicodeバグを世界から一掃しつつある件について
note.mu/
ruiu/n/nc9d93a45c2ec