09/03/20 22:58:52
すいません。教えてください。
VS2008 EXPRESS VC++です。
UTF-8のファイルの文字列をトークンで分割できません。
String^ path="C:\\test.txt";
System::String::Encording^ enc = System::String::Encording::GetEncording("utf-8");
String^ line;
array<String^>^ parse;
array<String^,1>^ delimita = gcnew array<String^>(1){"!<>\"\n\r"};
while( (line=sr.ReadLine()) !=nullptr){
parse=line->Split(delimita,System::StringSplitOptions::RemoveEmptyEntrys);
.
.
.
}
parseの中にlineの内容がそのまま入ってしまうのです。
lineの中には"<!DOCUTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
とはいっています。
"!"や"<",">"等で区切りたいのです。