08/02/13 00:13:40
海外のプログラマーはどうしてるんかね?
マルチバイトカンケーネーであまり気にしないんだろうか。
普段はstd::stringでも構わないんだけど
GetWindowTextとか使うときに不便だから
ここらへんを一まとめにしたようなのどこかにないかね。
211:デフォルトの名無しさん
08/02/13 14:07:59
中国人とかも困ってるだろうにね。
212:デフォルトの名無しさん
08/02/13 18:58:13
>>210
今度の改定でstd::basic_string<>も
vector同様に要素がメモリ上で連続されることが保証されるようになるらしい。
213:デフォルトの名無しさん
08/02/13 21:50:47
中国人は字が読めるヤツは英語も読めて
英語出来ないヤツは字も読めないから問題ないんだよ
214:デフォルトの名無しさん
08/02/13 21:52:32
国内向けアプリは普通中国語で作るんだろ?
215:デフォルトの名無しさん
08/02/13 22:24:57
それはどうかな
216:デフォルトの名無しさん
08/02/14 05:32:36
仕事でパソコンを使う奴は英語でいいし、英語を読めない奴にパソコンを教えても使えないから問題ない。
217:デフォルトの名無しさん
08/02/14 12:28:31
ワープロやエディタのように英語が読めてもデータとして中国語を扱う必要もあるだろうに。
218:デフォルトの名無しさん
08/02/14 19:21:56
その場合は、中国語だけを扱えばいいから何の問題もない
219:デフォルトの名無しさん
08/02/18 08:04:42
アニメ「さよなら絶望先生」には
糸色 望(いとしき のぞむ) → 絶望
糸色 命(いとしき みこと) → 絶命
糸色 交(いとしき まじる) → 絶交
こういったネタが出てくるのですが、これって文字コードの正規化の一種ですよね?
人気アニメでも使われるくらいなので、かなりニーズのある処理だと思うのですが、
残念ながらこういった「文字の結合」ができるライブラリを寡黙にして知りません。
そこでお願いなのですが、是非新たな文字列クラスにはこういった機能をデフォルトで組み込んでもらえませんか?
220:デフォルトの名無しさん
08/02/18 08:40:08
>こういったネタが出てくるのですが、これって文字コードの正規化の一種ですよね?
いいえ。
>残念ながらこういった「文字の結合」ができるライブラリを寡黙にして知りません。
それを言うなら、「寡聞にして存じ上げません」でしょう。
221:デフォルトの名無しさん
08/02/18 12:41:52
雲
雲雲
龍 ←これで一字
龍龍
>>これって文字コードの正規化の一種ですよね?
>いいえ。
222:デフォルトの名無しさん
08/02/18 13:34:06
>>221
言葉遊びとごっちゃにしてませんか?
223:デフォルトの名無しさん
08/02/18 15:01:13
糸色 = 文字コードの正規化
>>221 = 言葉遊び
なぜそう言いきれるのか理由を説明してくれ。
コンピュータにも分かるように。
224:デフォルトの名無しさん
08/02/18 15:33:56
>>223
逆。
>219は言葉遊び。通称「絶望」先生は、本名「糸色望」なのだから。
225:デフォルトの名無しさん
08/02/18 19:19:25
>>205
エンコーディングの自動判別機能については文字列クラスじゃなく、
フリー関数かlocaleを表現するクラスのメンバ関数に持たせるべきだと思う。
国際化された検索機能などを文字列クラス自体が持つとすると、
文字列はエンコーディングとバイト列の組になっているか、
あるいは特定の内部コードに正規化されているはずだけど
自動判別アルゴリズムの入力は「バイト列」と「エンコーディングの候補」になる。
これらを与えることが可能な場所はコンストラクタしかないが、
コード変換しないでエンコーディングだけ知りたい場合に困ってしまう。
226:デフォルトの名無しさん
08/02/19 01:58:32
きっと>>219が言いたかったのは
文字コードで悩むならいっそ画像化して画像解析すればいいじゃない
ってことだろう。
無いな。
227:219(本物)
08/02/19 18:01:30
私の言いたかったことは
「言葉遊びで言葉遊びを説明する・・・
そんな言葉遊びを言葉遊び的に言葉遊びで言葉遊びするという
言葉遊びを言葉遊びしてほしい」
ということです
228:デフォルトの名無しさん
08/02/25 21:12:30
縦読みも正規化だな
229:デフォルトの名無しさん
08/03/09 22:31:12
俺は>>198ではないがオレ流に作ってみたので晒してみる
つ URLリンク(sij.dip.jp)
話にならんってレベルだったらスルーしてくれ…
230:デフォルトの名無しさん
08/04/13 18:49:20
>>229
亀レスだが、文字コードによって文字列クラスを変えるのはどうかと思う。
内部フラグか何かでどうにかならんかな?
こういうことがしたい)
strjp sjis("Shift_JIS文字", encoding::sjis);
strjp euc("EUC文字", encoding::euc);
sjis = euc;
euc = sjis.conv_to(encoding::euc);