【R言語】統計解析フリーソフトR 第5章【GNU R】at MATH
【R言語】統計解析フリーソフトR 第5章【GNU R】 - 暇つぶし2ch71:132人目の素数さん
13/12/11 07:27:37.57 .net
そんな主張への反論だそうだ。こちらは訳されないだろうが。
URLリンク(blogs.computerworld.com)
URLリンク(blog.revolutionanalytics.com)

72:132人目の素数さん
13/12/11 10:31:49.73 .net
k-meansクラスタリングで質問があります
クラスタリングベクトルを出した後、その結果を元のデータフレームに結合して
それをもとに条件抽出し該当データフレームを抽出したいのですが、クラスタリングベクトルの数値を条件にすることはできないのでしょうか
たとえば、
SEX HEIGHT WEIGHT
1 F 158 51
2 F 162 55
3 M 177 72
4 M 173 57
5 M 166 64
とあったとき
SEX HEIGHT WEIGHT CLUSTER
1 F 158 51 1
2 F 162 55 2
3 M 177 72 3
4 M 173 57 3
5 M 166 64 2
というように結合してCLUSTERの数値をもとに抽出を行いたいです

73:132人目の素数さん
13/12/11 11:19:27.24 .net
>>69
両方使ってるけどね

74:132人目の素数さん
13/12/11 16:01:23.35 .net
>>71
> (a <- data.frame(sex=factor(c("F","F","M","M","M")), height=c(158,162,177,173,166), weight=c(51,55,72,57,64)))
sex height weight
1 F 158 51
2 F 162 55
3 M 177 72
4 M 173 57
5 M 166 64
> a$sex <- as.numeric(a$sex)
> cl <- kmeans(as.matrix(a), 3)
> (b <- cbind(a, cluster=cl$cluster))
sex height weight cluster
1 1 158 51 1
2 1 162 55 1
3 2 177 72 2
4 2 173 57 3
5 2 166 64 3

3だけ抽出
> b[b$cluster == 3, ]
sex height weight cluster
4 2 173 57 3
5 2 166 64 3

こういうこと?ちなみに、cbind()で結合する必要はないよ。

75:132人目の素数さん
13/12/14 16:20:31.15 .net
R使ってる人って分析前のデータ整形もRでやろうとするけど、これって効率的なのか?
整形はExcelでやって、統計解析だけRを使うのは異端なのか?

76:132人目の素数さん
13/12/14 16:28:21.09 .net
整形は自分で別途バッチを組むな

77:132人目の素数さん
13/12/14 19:08:13.08 .net
SQLじゃね?

78:132人目の素数さん
13/12/14 21:05:34.56 .net
>>74
そんなことはないし、Excelでも何でも使えるなら使えば良いと思う。
でも、世の中のデータはそんな単純なデータばかりじゃない。

79:132人目の素数さん
13/12/14 23:12:19.65 .net
>>74

RExcelとか使うでしょ。

他にも
「RとRubyによるデータ解析入門」とか
「R&JavaScriptによるデータ解析と視覚化テクニック」
とか言う本が出ているくらいだから、お察し。


ただ、最近は、R使わずに全部Pythonでやっちゃえとかいう Python好きが居て、
それはそれでうっとおしい。

80:132人目の素数さん
13/12/15 00:21:48.74 .net
>>74 >>78
コマンド一つで処理できれば言語はどうでもいい。適当なのを使えばいいだけ。

81:132人目の素数さん
13/12/15 01:35:28.58 .net
>>78
俺のことか?

82:132人目の素数さん
13/12/19 15:45:13.08 .net
平均値の95%の信頼区間の下限値を数値として、取り出したいのだけど。
t.test()だと、T検定の平均値ほかいくつもの結果が表示される。
他のプログラムからRの計算結果(信頼区間の下限値)だけを取り出したいのだが。
良い方法ありますか?

83:132人目の素数さん
13/12/19 16:11:17.73 .net
>>81
よく分からないな。
信頼区間の下限値を取り出せばよいのでは?
例えば、t.test()はhtestクラスのlistを返す。そのlistにはconf.intという名前の要素があり、
それは数値ベクトル(要素数は2)だ。その1つめの要素が下限。

他のプログラムって何?javaやpythonなど専用のインファーフェイスがあるよ。
探してみれば?
パイプで渡したいなら、パイプで渡せば良い。
パイプで渡すならこんな感じ?
$ Rscript -e 't.test(1:100)$conf.int[1]' |sed 's/¥[.¥]//g'
44.74349

84:132人目の素数さん
13/12/19 18:57:49.90 .net
$conf.int[2]
をつけて解決しました。
ありがとうございます。

他のプログラムというのは、CのDLLです。Rccpを利用するか悩みどころです。

85:132人目の素数さん
13/12/19 19:33:06.33 .net
>>83
それ、下限じゃなくて上限では?

> 他のプログラムというのは、CのDLLです。Rccpを利用するか悩みどころです。
またしても意味不明瞭。よく分からないな。
Rの中からCプログラムを呼び出すのか、Cプログラムの中でRを呼び出したいのか。
なぜ、exeじゃなくてdllと言うのか。「CのDLL」という表現ならWindows限定なのか。
Windows限定ならRと通信する方法がもっと別にあるのじゃないだろうか。

86:132人目の素数さん
13/12/19 23:40:49.36 .net
>それ、下限じゃなくて上限では?
すいません。$conf.int[1]で下限ですね。
>またしても意味不明瞭。よく分からないな。
>Rの中からCプログラムを呼び出すのか、Cプログラムの中でRを呼び出したいのか。
Cプログラムの中でRを呼び出したいです。

これはきちんと説明せねば。少し長くなりますが、、
MT4という為替取引(いわゆるFX)を支援するアプリがあり、
このアプリには自由に取引のアルゴリズムを作れるよう独自のプログラム作成機能があります。
その言語がC言語に似たmqlと呼ばれるものです。
通常は、mqlファイルを専用のコンパイラでコンパイルしてMT4で実行します。
ただ、MT4で実行されるものはメモリや実行速度において弱い部分があり、
その為、MT4に利用できる.dllをC言語などで作成し、dll上でアルゴリズム計算をさせMT4に返す
という方法をとる人もいます。というか自分がそういう状態です。

MT4(mql) → my.dll
記述的にはmqlファイルにmy.dllをimportさせます。

このdllから、Rに対して統計的な計算をさせその結果を得たいと思案して先の質問となりました。
t.test()で表示される内容は解っていたのですが、そこから数値だけをどうすれば返すのか、わからなかったのです。

87:132人目の素数さん
13/12/19 23:42:24.49 .net
当方は、直接dllからRに対して計算をさせその結果を返す方法を知りません。
どうやら、Rcppを使えば良いかも?というレベルです。
ただし、MT4において、mt4R.dllというフリーのライブラリがあり、それを用いると
簡単な記述でMT4とRを連携させることができます。それは当方も確認済みです。
下のような流れです。
MT4(mql) → mt4R.dll → R
さて、自分は my.dllを作成していますが、mt4R.dllを利用してRを計算するには、
MT4(mql) → my.dll → MT4(mql) → mt4R.dll → R
という手順を踏まないといけません。MT4(mql) ⇔ my.dllとの配列の扱いも実は面倒な仕様があり、できれば
MT4(mql) → my.dll → R
のように直接my.dllからRを呼び出し計算させその答えが得たらいいなと思います。
とりあえず、t.test()から知りたい統計結果だけをとりだせたのでまずは一歩すすみました。
Rcppを持ちいるほかに良い方法があるようでしたら、教えてくだされば幸いです。

88:132人目の素数さん
13/12/20 00:14:58.57 .net
書き忘れました。MT4はWindowsで動作できるアプリです。

89:132人目の素数さん
13/12/20 00:41:08.46 .net
URLリンク(cran.r-project.org)
このあたりを読むか、
RCOMのようなものを使うか
URLリンク(sunsite.univie.ac.at)

90:132人目の素数さん
13/12/20 11:49:32.67 .net
ありがとうございます。
よく読んで参考にさせていただきます。

91:132人目の素数さん
13/12/20 17:05:17.55 .net
参考にするってのは何もしないという意味の枕詞

92:132人目の素数さん
13/12/20 17:10:08.26 .net
一理あるw

93:132人目の素数さん
13/12/21 10:17:02.43 .net
>>90
参考になる意見だな

94:132人目の素数さん
13/12/22 19:47:07.69 .net
すみません、このサイトナノデスの
URLリンク(d.hatena.ne.jp)

kabu_data_close = as.ts( scan( "/home/yuta/work/R/kabu/data/kabu_ar_training_close.txt" ) )
ar_predict_result <- matrix()
arima_predict_result <- matrix()
j <- 1
for( i in 123:136) {
training_kabu_data <- kabu_data_close[1:i]

#ARModel
ar_data_close <- ar( training_kabu_data )
ar_predict_close <- predict( ar_data_close, n.ahead = 1 )

#ARIMAModel
arima_data_close <- arima( training_kabu_data, order=c(1,0,1) )
arima_predict_close <- predict( arima_data_close, n.ahead = i )

ar_predict_result[j] <- ar_predict_close$pred[1]
arima_predict_result[j] <- arima_predict_close$pred[1]

j <- j+1
}

scanでよみこんだtxtはデータの数が123こあります。なのにfor文は123:136で
<- kabu_data_close[1:i]となっています。123以降はkabu_data_closeには入ってないのではないのでしょうか??


というか違うデータでですがError in na.fail.default(as.ts(x)) : missing values in object
とでます

95:132人目の素数さん
13/12/22 21:29:08.90 .net
>>93
エスパー募集ですか?
さすがに、kabu_data_closeの構造を秘密にされたら答えようがない。
str()ぐらい示そうよ

ちなみに、
> hoge <- as.ts(1:100)
> str(hoge)
Time-Series [1:100] from 1 to 100: 1 2 3 4 5 6 7 8 9 10 ...
> hoge[101:110]
[1] NA NA NA NA NA NA NA NA NA NA
という仕様。

96:132人目の素数さん
13/12/22 23:07:53.72 .net
>>94
返信ありがとうございます。
>>93のkabu_data_closeとは違いますが

> kabu_data_close = as.ts( scan( "C:/Users/root/Documents/kabu_ar_training_close.txt" ) )
Read 120 items
> ar_predict_result <- matrix()
> arima_predict_result <- matrix()
> j <- 1
> for( i in 120:133) {
+
+ training_kabu_data <- kabu_data_close[1:i]
以下同文

Error in na.fail.default(as.ts(x)) : missing values in object

> str(kabu_data_close)
Time-Series [1:120] from 1 to 120: 10688 10599 10508 10579 10653 ...

とでます

97:93
13/12/23 00:09:31.23 .net
>>93のサイトのままなのでコードはかえないでいいはずなのですが
したいことは一回一回学習して予測することです。

+  j <- j+1
kabu_data_close[i+1]<-ar_predict_result[j]

}
を加えてみましたが
Error in `[<-.ts`(`*tmp*`, i, value = NA_real_) :
only replacement of elements is allowed
とでます。

98:93
13/12/23 01:17:20.89 .net
すみません。解決しましたmm;;
サイトのコメント欄に同じ質問がありました。。。

99:132人目の素数さん
13/12/23 07:48:48.61 .net
>>97

そういうときは、どういう風に解決したかをまとめて、ここにも貼るものでしょ!

100:132人目の素数さん
13/12/23 08:53:02.60 .net
普通は回帰係数を求める時っていろんな説明変数を試すものなのに、
株価予測は株価だけしか使わないのが当たり前になってるのが不思議。

101:93
13/12/23 09:00:50.98 .net
>>98
普通にfor文の136までのデータを使ってるようでした;;
技術的な問題じゃないので申し訳ないのですが

予測するデータは2012年7月以降、学習データは2012-01-04~予測の前日
このサイトの流れから予測の前日というのが7月の前日まで
と勘違いしていました。;

102:132人目の素数さん
13/12/23 09:37:21.10 .net
自分には何を言ってるのか分からんが、本人が分かったならそれでいいのでは?

103:132人目の素数さん
13/12/23 10:59:31.69 .net
>>101
scan()するデータがそもそも間違っていたのに、
思い込みが原因で混乱していましたってことだろ(違うかもしれんが)。
最小のサンプルデータも提示せず、まさしく「エスパー募集」だったてことだ。

104:132人目の素数さん
13/12/23 12:14:20.03 .net
Error in arima(training_kabu_data, order = c(1, 0, 1)) :
non-stationary AR part from CSS
In addition: Warning messages:
1: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
2: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
3: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
すみません。このエラーってどうゆう意味でしょうか;;

105:132人目の素数さん
14/01/07 14:10:27.54 .net
Rを用いたパネル分析(ランダム効果モデル)におけるエラーについて
Rを用いて、パネル分析を行ったのですが、
「 以下にエラー swar(object, data, effect) :
the estimated variance of the individual effect is negative」
というエラーが出てきます。

どのような対処を行えば、エラーを解消することが可能でしょうか。

106:132人目の素数さん
14/01/07 14:47:31.73 .net
>>104
エスパー募集ですか?
負の分散が生じるということはデータに問題があり、解決策はない気がしますが、
あなたが書いた式にケアレスミスがあることが原因である場合は、
エスパーでもない限り、読み手には分かりません。

再現できる最小のサンプルデータセットと、サンプルコー�


107:hを示せば、 誰かがあなたの間違いを指摘してくれるかも知れません。 まずは、データを半分、そのまた半分と削って、エラーの再現を確認してはどうですか。



108:132人目の素数さん
14/01/11 13:25:36.74 .net
すみません、Mac OS X Mavericksで、R3.0.2をつかっているのですが、起動すると下記のような警告メッセージが表示されるようになってしまいましたが、意味がよくわかりません・゜・(ノД`;)・゜・
何がおきているのでしょうか・・・

During startup - Warning messages:
1: Setting LC_CTYPE failed, using "C"
2: Setting LC_COLLATE failed, using "C"
3: Setting LC_TIME failed, using "C"
4: Setting LC_MESSAGES failed, using "C"
5: Setting LC_MONETARY failed, using "C"
[R.app GUI 1.62 (6558) x86_64-apple-darwin10.8.0]

WARNING: You're using a non-UTF8 locale, therefore only ASCII characters will work.
Please read R for Mac OS X FAQ (see Help) section 9 and adjust your system preferences accordingly.
[Workspace restored from /Users/ユーザ名/Documents/R/R_Working/.RData]
[History restored from /Users/ユーザ名/Documents/R/R_Working/.Rapp.history]

2014-01-11 13:20:07.129 R[1292:707] Can't open input server


109: /Users/ユーザ名/Library/InputManagers/SafariStand5.1.182



110:132人目の素数さん
14/01/11 13:39:16.70 .net
きもい

111:132人目の素数さん
14/01/11 13:55:39.23 .net
>>106
意味も何も、読んだそのままの意味だと思うけど。
ローケルがCなら、日本語を使っちゃダメだよ。
ターミナルでRと打ち込んでRを起動させたら何か変化がある?

112:106
14/01/11 14:30:33.12 .net
>>108
言語の問題だったですか・・・
最近、Macの言語環境を英語⇔日本語で何回か切り替えたのですがそれがいけなかったんでしょうか(ふだんは英語環境)

とりあえずあとでlocaleというのの設定をやってみます(localeという言葉をそもそも知らず、localかと思いました)

ターミナルから起動したら、とくに警告は表示されなかったです

113:132人目の素数さん
14/01/12 12:58:03.91 .net
[1]1 2 3 4 5 6 7
[2]8 9 10

1
2
3
4
5
6
7
8
9
10

と表示させるにはどうせたらよいでしょうか

114:110
14/01/12 13:58:14.10 .net
すんません、解決しました

115:132人目の素数さん
14/01/12 14:05:21.37 .net
おお、ちょうどレスしようと思ったのに
> a<-1:7
> b<-8:10
> c<-c(a,b)
> c.df<-as.data.frame(c)
> c.df

一応どうやって解決したかも書いてほしいな

116:132人目の素数さん
14/01/12 19:39:44.30 .net
ans<-lm(ch1~.,data)
ans2<-stepAIC(ans)
(略)
Step: AIC=6680.92
ans3<-lm(ch2~.,data)
ans4<-stepAIC(ans3)
   (略) 
Step: AIC=6260.8

(略)

ans47<-lm(ch24~.,data)
ans48<-stepAIC(47)
(略)
Step: AIC=8953.5

この出力されたAICの値(計24個)の値を比較して一番値が低いAICを表示したいです。
できる人いましたらやり方教えて下さい。

117:132人目の素数さん
14/01/12 21:27:42.56 .net
データフレームで、各行のすべての列の値を合計した列をつくることってできますか?
たとえば列が1月、2月、3月、、、ってなってて最後に年間計の列をつくりたいとか。
列を1個1個ベクトルで取り出して合計してからデータフレームに入れないとダメ?

118:132人目の素数さん
14/01/12 21:53:48.36 .net
data$total <- apply(data, 1, sum, na.rm=TRUE)

119:132人目の素数さん
14/01/12 22:09:11.87 .net
こうスレをみると、データフレームの勉強はした方が良さそうだな。
Rで統計計算ができるよお。だけじゃなくて、どうやってデータを揃えるかとかが大事になってくるなあ。

120:132人目の素数さん
14/01/13 00:19:12.09 .net
>>115
ありがとうございます。
そうでした、applyだった・・・
R-Tipsを読み直しました。

>>116
初心者なんですが、基本の操作を早く覚えたいです・・・

121:132人目の素数さん
14/01/13 11:04:58.62 .net
列名称やベクトルの名称などの、数字ではない情報を、for文などによって繰り返しで大量に生成することってできますでしょうか?
たとえば、"V1"という名称のベクトルから"V100"という名称のベクトルを、何らかの規則(たとえば1~99までの奇数の列を1倍したベクトル、2倍したベクトル、3倍したベクトル……など)

ようは、規則にしたがって名前をたくさんつけるという操作が可能なのかどうかを知りたいです

122:132人目の素数さん
14/01/13 11:05:58.75 .net
途中が消えてましたm(_ _)m

列名称やベクトルの名称などの、数字ではない情報を、for文などによって繰り返しで大量に生成することってできますでしょうか?
たとえば、"V1"という名称のベクトルから"V100"という名称のベクトルを、何らかの規則(たとえば1~99までの奇数の列を1倍したベクトル、2倍したベクトル、3倍したベクトル……など) に従って生成したい場合などです

ようは、規則にしたがって名前をたくさんつけるという操作が可能なのかどうかを知りたいです

123:132人目の素数さん
14/01/13 11:50:16.18 .net
as.character()

124:132人目の素数さん
14/01/13 16:12:10.53 .net
マニュアル読む気ゼロな奴が住み着いたな

125:132人目の素数さん
14/01/13 21:38:05.76 .net
>>120
ありがとうございます

126:132人目の素数さん
14/01/15 03:09:36.46 .net
&amp;&amp; || をにデータフレームの条件に使ってもエラー出ないのえ�


127:ョくない? ifの癖で間違っちゃうのだが。



128:132人目の素数さん
14/01/15 03:10:17.66 .net
あれっ?なんか文字化けみたいになったw

129:132人目の素数さん
14/01/15 13:59:16.86 .net
質問があります
A B
10 0.6
20 1.7
30 6.9
2.5 0.3
15 5.7
30 6.9
11 0.1
38 3.2
45 4.8
70 6.8
というようなデータフレームがあるのですが
Bは0<B<7の範囲をとる数字になっていていくつもの昇順データの連結物になっています
これをBの値が大きいものから小さいものに変わったときで切ってデータフレームを新しく切り出したいのですがどうしたらいいでしょうか

130:132人目の素数さん
14/01/15 20:22:02.46 .net
>>113
traceの最後に出てくるAICはextractAIC()で取出せるから、
ans2, ans4, ..., ans48をリストにして、
sapply(selectedModelList, extractAIC)して、sort()

>>125
グループ化すれば
grp <- 1
for(i in 2:nrow(data)-1){
if(data$B[i] < data$B[i+1]) grp <- c(grp, grp[i])
else grp <- c(grp, grp[i]+1)
}

131:132人目の素数さん
14/01/15 21:33:41.22 .net
psychというパッケージをつかってるんですが、たとえばfa()関数で因子分析をやったときに、その結果を全部まとめてcsvに出すことってできないんでしょうか?
因子パタンだけを
write.csv(分析結果$loadings, "分析結果.csv", quote=F)
とかやることはできるのですが、一式全部出力できないもんかと……

132:132人目の素数さん
14/01/17 01:55:48.44 .net
行列でできなくてデータフレームだとできることって何があるの?

133:132人目の素数さん
14/01/17 10:39:00.75 .net
>>127
>一式全部
多義的な表現なので、全部とは具体的にどのことかきちんと説明しないと、
期待する助言は得られないよ。Rオブジェクトとそのものなのか、
printメソッドなのか、summaryメソッドなのか、strか?

134:132人目の素数さん
14/01/17 10:45:33.92 .net
>>125
ずばっとやる方法は思いつかないなぁ。
B[i] > B[i+1]が成立したときのiを取り出して、
そこで切るとか。

135:130
14/01/17 10:48:05.50 .net
>>126 がすでに答えていたorz
なるほどね。グループ番号を付与するか、
思いつかなかった。

136:132人目の素数さん
14/01/17 18:02:57.01 .net
>>126
for文じゃなくてベクトルで一括処理するなら、
grp <- cumsum(c(F, diff(data$B)<0)) かな。

137:132人目の素数さん
14/01/17 20:05:05.18 .net
>>132
オォそれはスッキリ。皆よくヌルっとそういうのが出てくるね

138:132人目の素数さん
14/01/17 20:16:05.94 .net
>>132
すげー、天才だ!
こんなのが思いつくなって人間じゃない、イカれている

139:132人目の素数さん
14/01/18 17:02:01.35 .net
.Rprofileって、ワーキングディレクトリに置いておけばいいのでしょうか?
分析ごとにワーキングディレクトリをかえようと思っている場合、.Rprofileをコピーしてそれぞれのディレクトリにいれて、setwd()すればいいだけでしょうか?
Rを立ち上げているとき、どの.Rprofileが読み込まれて作動しているのか確認する方法が分からず・・・

どなたかアドバイスおねがいします

140:132人目の素数さん
14/01/18 17:45:25.40 .net
>>135
> どの.Rprofileが読み込まれて作動しているのか確認する方法

$ cat .Rprofile
Rprofile.version <- "1.0"

として、Rを起動してみると、
> ls()
[1] "Rprofile.version"
と.Rprofileが読み込まれている。
中身はもちろん
> Rprofile.version
[1] "1.0"
となる。つまり、識別のためのRオブジェクトを個別に.Rprofileに書いておけば、
区別はつく。

141:132人目の素数さん
14/01/18 17:57:56.34 .net
>>135
> .Rprofileって、ワーキングディレクトリに置いておけばいい
はい。ただし、起動時のカレントディレクトリとワーキングディレクトリが異なる場合は駄目。

?Rprofile
?Rprof
あたりは読もう。

142:132人目の素数さん
14/01/18 18:24:59.19 .net
>>136
なるほどたしかに!
ありがとうございます。

.Profileの置き場は、起動時の初期ワーキングディレクトリにおいてあるものが読み込まれるみたいなので、
preference > start upの画面で設定したディレクトリに置いとくしかないことも分かりました。

143:132人目の素数さん
14/01/18 18:26:04.88 .net
>>137
ありがとうございます
勉強します

144:132人目の素数さん
14/01/18 19:53:17.68 .net
>>138
Rを起動する流儀はひとそれぞれだけど、
csvファイルなどデータをおいたワーキングディレクトリに移動して、
csvファイルの中身や、その他のファイルの確認をしてから、
そこで(そのディレクトリで)Rを起動すると、
起動時のカレントディレクトリとワーキングディレクトリは同一になる。
つまり、ワーキングディレクトリに移動してからRを起動した方がいろいろと都合がよいし、
私はRを使い始めて10年来、このようにRを起動している。

どのディレクトリでRを起動しても、あなたの自由だよ。

145:132人目の素数さん
14/01/18 19:56:04.16 .net
>>140の追記。
ワーキングディレクトリに移動してからRを起動すると、
そのときにワーキングディレクトリに置かれた.Rprofileを読み込む。
だから、それぞれのワーキングディレクトリにそれぞれの.Rprofileを置くのは正解。

146:132人目の素数さん
14/01/18 23:17:37.61 .net
レベルの低いお話で恐縮です。
Rでは推測統計などで利用をしていましたが。プログラム的なものを作りたいと思うのですがちょっと歯が立たないです。
きっかかりを付けたいと思います。以下のような内容をスクリプトで書くと、どうなるかご提示いただけますでしょうか。

5*10の行列(一般的な意味)を用意して、これを"matA"とします。
//2行4列の場所をmatA[2][4]とします。

rowA = 3 colA = 5 coubA = 0.3 をmatAに入力します。
//上の式の意味はmatA[3][5]に0.3を配置します。という意味です。

以下同じように
rowA = 2 colA = 7 coubA = -0.3 をmatAに入力します。
rowA = 1 colA = 4 coubA = 0 をmatAに入力します。
rowA = 3 colA = 5 coubA = 0.4 をmatAに追加します。※
rowA = 1 colA = 4 coubA = 0.3 をmatAに追加します。※

//追加されたデータは元のデータ上に重ねていく3次元のイメージです。追加されるデータは、今後も増えていきます。
matA[2][7]を参照する。→ (-0.3) が返ってくる。(-0.3 0) が返ってくるのはNG
matA[3][5]を参照する。→ (0.3 0.4) が返ってくる。
matA[1][2]を参照する。→ 何も返さないか。(NA)が返ってくる。(0)や(0 0)が返ってくるのはNG

以上、お時間のある方、ぜひご教授くださいませ。

147:132人目の素数さん
14/01/19 01:07:18.05 .net
>>140
ありがとうございます
移動ってのは、ターミナルで操作されてるということでしょうか

148:132人目の素数さん
14/01/19 01:34:21.33 .net
>>142
arrayを使うのはどう?
簡単のために、重ねの最大が2つまでとして、
> matA <- array(NA, c(5, 10, 2))
> matA[3, 5, 1] <- 0.3; matA[2, 7, 1] <- -0.3; matA[1, 4, 1] <- 0;
> matA[3, 5, 2] <- 0.4; matA[1, 4, 2] <- 0.3
> matA[2, 7, ]
[1] -0.3 NA
> matA[3, 5, ]
[1] 0.3 0.4
> matA[1, 2, ]
[1] NA NA

NAがいやなら、na.exclude()でも使えばいい。
matA[3, 5, i]がNAでないなら、matA[3, 5, i + 1]に代入するような条件分岐で一般化すればいい。
別アプローチとしては、要素がlistの行列を作るという手もある。

149:132人目の素数さん
14/01/19 10:01:05.38 .net
>>142
matA<-matrix(NA,nrow=5,ncol=10)
じゃあダメなの?

150:132人目の素数さん
14/01/19 11:02:43.98 .net
>>144さん>>145さん ありがとうございました。スルーされるかと思ってた。

>>145さん。matrix 使うべきなのか array を使うべきなのか list なのか。
まだよく分かっていないのが正直なところです。

>>144さん スクリプト作成。ありがとうございます。
リストを使うのは難しくなりますでしょうか?
イメージとしては5*10の行列の碁盤の上に、個々のベクトルが上に育っていくような。
わかりずらいですね、、。
追加されていく要素は、今後も増えていく予定です。
重ねの数を初期値で


151:決めずに、追加される要素によって個々に増えていくという設定は難しい でしょうか。



152:132人目の素数さん
14/01/19 14:17:08.53 .net
>>146
リストがお好みなら
> dat <- data.frame(rowA=c(3, 2, 1, 3, 1), colA=c(5, 7, 4, 5, 4), coubA=c(0.3, -0.3, 0, 0.4, 0.3)) #1
> dat2 <- dat[dat$coubA!=0] #2
> matA <- lapply(1:5, function(i) lapply(1:10, function(j) NULL))
> for(i in 1:nrow(dat2)) {
+ v <- dat2[i,]
+ matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)
+ }
> matA[[2]][[7]]
[1] -0.3
> matA[[3]][[5]]
[1] 0.3 0.4
> matA[[1]][[2]]
NULL

#1 データはデータフレームが分かり易いかと思ってそうしたけど、ベクタでもマトリクスでも
#2 先にcoubA==0を除いたけど後から条件分岐でも良い。
#3 どうも俺が書くと美しくない...( ´・ω・`)

153:132人目の素数さん
14/01/19 16:01:58.81 .net
>>145
ダメに決まってるじゃん。
質問者の要件を良く読めよ。

146 > 重ねの数を初期値で決めずに、追加される要素によって個々に増えていくという設定
どうしても初期値があるとダメなら、
144 > 要素がlistの行列を作るという手
なんだけど(または >>147さんの方法)、
10000とか10000000000000000とか十分に大きな値を初期値に出来ないの?

>>143
はいそうです。実際には、Emacsの中でRを起動する訳だけど、
ターミナルというか、シェルから起動するのと概念的に同じです。
ソフトウェアの起動には2つに大別できて、
(1) ランチャーメニューから起動→ファイルを読み込む
(2) ファイルのあるディレクトリまで移動してファイルを開く=ソフトを起動する
あなたは(1)の方法でRを起動し、私は(2)の方法で起動するという違い。
(2)の場合は、シェルの中で移動するわけだけど、
OS XやLinuxのシェルはbashだったり、WindowsのシェルだとExplorerだったり。
bashを使うにはターミナルが必要。

154:132人目の素数さん
14/01/19 20:40:17.23 .net
>>147
ありがとうございます。いただいたスクリプトを吟味させていただきます。
これだけ作っていただけたら、リファレンス本を元に解読して理解できるようになると思います。

ついで、、読み飛ばしてかまいません。
自分の環境では以下の行で
dat2 <- dat[dat$coubA!=0]
次のエラーが発生してそれ以降の行で実行不可になってしまったのですが、
underfined colums selected
何かの理由があるか、自分の基本的なところの無知なんでしょうね。

>>148
フォローありがとうございます。
>10000とか10000000000000000とか十分に大きな値を初期値に出来ないの?
最終的には、10000件もの行列の要素の上にデータを重ねようと思っています。
Rがどのようにメモリを扱っているかわかりませんが、初期値によってメモリを確保する
のであれば避けておきたいと思っています。

155:132人目の素数さん
14/01/19 21:25:30.81 .net
>>149
すんません。コピペの後ごにょごにょしてたらカンマを落としたようです。
dat2 <- dat[dat$coubA!=0,]

156:132人目の素数さん
14/01/19 21:49:59.45 .net
すいません。ほんとうにありがとうございました。

157:132人目の素数さん
14/01/22 01:01:42.23 .net
>>147
ありがとうございます。
いろいろ検証させていただいています。
もう完璧ですね。Rに慣れていないから、と思っていたけど。
Rに慣れてもこのようなコード書けるかは自信がありません。

でもありがとうございました。

158:132人目の素数さん
14/01/22 23:50:01.23 .net
嵐山光三郎でR

159:132人目の素数さん
14/01/23 18:55:29.92 .net
The R Journal
URLリンク(journal.r-project.org)

こんなんあったんですね

160:132人目の素数さん
14/01/23 19:52:35.00 .net
>>154
以前に、R NewsからJournalに昇格した。

161:132人目の素数さん
14/01/23 21:36:08.80 .net
本買って読み始めたんだけど、

scores <- data.frame()
scores <- edit(scores)

で、いきなりR落ちた。

162:132人目の素数さん
14/01/23 23:55:51.45 .net
すいません先の>>147のスクリプトの下の文なのですが1行で表すことは可能でしょうか。
あるアプリから、この文をRに渡したいのですが。1構文1行じゃないといけないらしくて。
単純に改行を削るだけではRでエラーを返してしまいます。

> for(i in 1:nrow(dat2)) {
+ v <- dat2[i,]
+ matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)
+ }

163:132人目の素数さん
14/01/24 00:11:54.52 .net
>>157
よく分からないけど、1行なら
for(i in 1:nrow(dat2)){v <- dat2[i,]; matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)}
だけど

164:132人目の素数さん
14/01/24 01:15:10.35 .net
>>158
セミコロンが構文の区切りなのですね。
うまく動きました。ありがとうございました。

165:132人目の素数さん
14/01/24 10:11:36.08 .net
>>159
まじで入門書を一度通読した方がよいと思う。

166:132人目の素数さん
14/01/25 00:04:22.24 .net
分割表からロジスチック回帰で使うようなデータフレームを作成する方法ってありますか?

167:132人目の素数さん
14/01/25 06:39:47.14 .net
>>161
そんなオナニー質問で、本気で助言をもらえると思ってるの?

168:132人目の素数さん
14/01/25 14:55:11.73 .net
うっせーハゲ

169:132人目の素数さん
14/01/25 15:34:42.28 .net
>>163
>>161本人か?
本人なら、分かるように質問し直せよ。
それとも、あんたは、
1. 先日拾った木材から寝室で使うような家具を作成する方法はありますか?
2. 朝摘みした野菜から夕食に出せるような食事を作成する方法はありますか?
3. 数字を使って数学のテストに出題するような問題を作成する方法ありますか?
という質問に対して、質問者が期待する回答を与えられるのか?

170:132人目の素数さん
14/01/25 16:42:32.84 .net
初心者には初心者に分かりやすく説明すればいいんだよ
お前は単に偉そうに説教したいだけだろ
2ちゃんでやっすい承認要求みたしておめでたい奴だなw

171:132人目の素数さん
14/01/25 17:11:47.96 .net
こういう毎日張りつくようなものでもないスレでカリカリしてるやつは見なきゃいいと思うんだけど
説明したいやつが説明するだろうし

172:132人目の素数さん
14/01/25 17:31:43.37 .net
>>165
はぁ?じゃあ、あなたは何故>>161 に答えてあげないのですか?
オナニー質問には答えようがないからでしょう?違いますか?
違うなら、あなたが助言してあげて下さい。
自分しか理解できないオナニー質問をするかしないかは、
質問者が初心者かどうかとは独立です。

173:161
14/01/25 22:30:46.52 .net
不完全な質問をして申し訳ありませんでした

その後Titanicのデータとepitoolsでなんとか理解することが出来ました.
カウントデータにNA が含まれていたため,分割表から個体ベースのデータフレームに出来ないことが判明しました..

お騒がせして申し訳ありませんでした

174:132人目の素数さん
14/01/25 23:26:11.74 .net
>>168
>>163>>161じゃなかったのなら非言申し訳ない。>>165が助言する様子はないので簡単に。
Rのglm()で指定するデータフレームは、必ずしも行が症例(個人)になっている必要はない。
条件ごとにカウントしたデータフレーム(たぶん、あなたが言う分割表)のデータフレームを用いる。
例えば、
> d <- data.frame(gender=rep(c("Male","Female"),c(6,6)),
+ dept=rep(LETTERS[1:6],2),
+ yes=c(512,353,120,138,53,22,89,17,202,131,94,24),
+ no=c(313,207,205,279,138,351,19,8,391,244,299,317))
> d
gender dept yes no
1 Male A 512 313
2 Male B 353 207
[snip]
11 Female E 94 299
12 Female F 24 317
という集計したデータフレームがあったとして、ロジスティックモデルを当てはめるには
下記のようにすればOK
> m <- glm(cbind(yes,no) ~ gender * dept, family = binomial(logit), data = d)
したがって、実験研究でよくあるカテゴリカルの場合は「個体ベースのデータフレーム」を用意する必要はない。

175:132人目の素数さん
14/01/26 00:26:27.29 .net
データが多くなると、DBの利用を考えたくなりますが、
お勧めありますか。SQLiteを使っている人が多い気がしますが。

176:132人目の素数さん
14/01/26 12:34:15.85 .net
これは良い正規分布
URLリンク(twicsy.com)

177:132人目の素数さん
14/01/26 21:49:02.61 .net
>>171
要するに、ほとんど運だということなのかね?

178:132人目の素数さん
14/01/27 22:44:56.77 .net
//質問させてください。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.3
matB[2,7,1]<--0.3
matB[1,4,1]<-0
matB[5,4,2]<-2.5

//という3次元の配列があるとします。
//数値要素以外はNAです。

//ここから3次元目の1つ目の表の最大値を取り出したいです。
//期待する値は0.3となります。
//apply(na.omit(matB),3,max)[1]など、いろいろ考えてみましたが
//違うようです。
//どのように表記すればよいか教えてください。

179:132人目の素数さん
14/01/28 00:39:30.32 .net
>>173
> max(matB[,,1], na.rm=TRUE)
[1] 0.3

180:132人目の素数さん
14/01/28 01:18:02.61 .net
>>174
ありがとうございました。

181:132人目の素数さん
14/01/28 10:13:11.86 .net
>>175
まぁ、これは初心者がはまりやすいポイントだからね。

> max(c(3, NA, 3, 3, 3))
[1] NA
> max(c(3, NA, 3, 3, 3), na.rm = TRUE)
[1] 3

182:132人目の素数さん
14/01/28 18:02:47.69 .net
>>176さん。ありがとうございます。
//>すいません、また質問させてください。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.1
matB[2,7,1]<-0.3
matB[1,4,1]<-0.3

//上のような3次元の配列があります。3次元目の一つ目の表には値が含まれていますが、
//二つ目の表は値が含まれておりません。

//3次元の各表に対して、値が入っているか値が入っていないかを知りたいと思います。
length(na.omit(matB[,,1]))
length(na.omit(matB[,,2]))
//では駄目でした。
//期待とする値は、入っているか入っていないかのブール値でも、
//入っている要素数の数(全部の要素がNAならば0)でも構いません。
//どうぞよろしくお願いします。

183:132人目の素数さん
14/01/28 18:30:56.14 .net
>>177
何か、このスレ、オレしか答えいない。

> for(i in seq_len(dim(matB)[3])){print(ifelse(sum(! is.na(matB[,,i])) == 0, "空でーす", "入っています"))}
[1] "入っています"
[1] "空でーす"

上記はmatB[,,1]は「入っています」、matB[,,2]は「空でーす」という意味。
forが嫌いなら、sapplyでも。

オナニー質問じゃない限りなるべく答えるけど、関数の意味は自分で調べてね。

184:132人目の素数さん
14/01/28 20:19:43.46 .net
>>178さん
同じ人でしたか。恐縮です。
もちろん関数の意味は、自分で調べます。
本当にありがとうございました。

185:132人目の素数さん
14/01/30 14:41:21.33 .net
//質問いたします。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.3
matB[2,7,1]<--0.3
matB[1,4,1]<-0
matB[5,4,2]<-2.5
maxvol<-max(matB[,,1], na.rm=TRUE)
maxvecB<-which(matB == maxvol)
lenrowB<-length(matB[,1,1])
if(maxvecB%%lenrowB==0){rowB <- lenrowB;colB <- maxvecB%/%lenrowB}else {rowB <- maxvecB%%lenrowB; colB <- maxvecB%/%lenrowB+1}

//上記は3次元の配列のうち3次元目の一枚目の表から、最大値を求め
//その要素の行値、列値を求めるスクリプトです。以下のように返ってきます。
> rowB
[1] 3
> colB
[1] 5

//わざわざ、maxvecBの要素番号を列の総数で割り、その剰余を利用して答えをだしています。
//たまたま、maxvecBの要素番号が列順に振られているのでうまくいきましたが、行順に振られていたら
//誤った値が返ってくるかと思います。
//もうすこし、シンプルな書き方があるような気がしてなりません。
//修正できるとこがありましたら教えていただきたいと思います。
//よろしくお願いします。

186:132人目の素数さん
14/01/30 15:30:36.11 .net
>>180
> シンプルな書き方
まぁ、そうだね。
> arrayInd(which.max(matB[,,1]


187:), dim(matB)) [,1] [,2] [,3] [1,] 3 5 1 とか。この位置の値を確認したければ、 > matB[arrayInd(which.max(matB[,,1]), dim(matB))] [1] 0.3 関数の意味は自分で調べてね。



188:132人目の素数さん
14/01/30 17:38:18.56 .net
ありがとうございます。いつもの同じ方でしょうか。
自分のが恥ずかしいぐらいシンプルです。
こうかけるようになれたらいいなあ。
ありがとうございました。

189:132人目の素数さん
14/01/30 17:47:03.20 .net
このスレ、かえって有害

190:132人目の素数さん
14/01/31 20:29:09.26 .net
rpubs.com って自分でホスティングするのは無理?

191:132人目の素数さん
14/02/02 21:38:49.85 .net
最近,emacsのorg-modeのorg-babelを使って,Rの解析結果をhtmlにexportした
レポートもどきを作成して,同僚に渡すようにしてる.やってることの解説と
code blockを交互に書くことで,同僚の理解も容易になって喜んでるんだけど,
問題は,code blockの数だけReturnを押さないといけないこと.5個や10個の
code blockなら良いけど,100個以上になると指がつりそうになる.全部を一気
に実行する方法を誰か知ってますか? スレ違いならゴメン.

192:sage
14/02/02 22:53:46.35 .net
>>185l
knitrはemacsもサポートしてるみたいだけど

193:132人目の素数さん
14/02/02 23:02:48.81 .net
グラフィックに続いておらいリーからまた本でたね。何でも載ってそうなんで、まよってるんだけど誰か買ったかな?

194:132人目の素数さん
14/02/03 00:02:22.42 .net
knitrは使ったことないんだけど,code blockを一気に処理できるの?

195:132人目の素数さん
14/02/03 18:19:44.13 .net
どなたか条件を指定して3次元プロットをする方法を教えていただきないでしょうか?
以下のデータを3Dプロットしようとする時、modernの値が3の場合赤、2の場合白、1の場合黄色とし、x軸はLの値、y軸はAの値、z軸はBの値としたいです。
L A B modern
1 48 54 32 3
2 21 32 15 2
3 87 2 78 2
4 45 102 12 3
5 54 91 31 2
6 7 21 81 3
7 87 64 12 1

196:132人目の素数さん
14/02/03 18:47:25.02 .net
>>189
3次元プロット自体はできるよね。
色分けは、例えばscatterplot3d()を使うなら、colorに色名のベクタを与えればよいだけ。
> modern <- c(3, 2, 2 ,3, 2, 3, 1)
なら、
> cols <- c("yellow", "white", "red")
> cols[modern]
[1] "red" "white" "white" "red" "white" "red" "yellow"
とすれば、色名のベクタが出来る

197:132人目の素数さん
14/02/03 19:08:02.33 .net
>>190
ありがとうございます。
3次元プロットは出来ます。
それぞれのデータ数が130ほどあるのですがこれも同じような形で解くのがよろしいのでしょうか?
質問ばかりしてしまい申し訳ないです。

198:132人目の素数さん
14/02/03 19:16:26.15 .net
できました!
本当に助かりました!

199:132人目の素数さん
14/02/03 22:32:09.24 .net
> knitrは使ったことないんだけど,code blockを一気に処理できるの?

自己レスです.ox-ravel.elというのを使えば,org-modeからknitrを使えるこ
とが分かった.URLリンク(github.com)
こいつでorg-modeからRhtmlを作って,それをRstudioにcompileさせるという流
れだな.複数のcode blockも一気に処理できるようだし,二度手間だけど100回
以上Return押すよりはマシなので,この方式に乗換を試してみる.初めて
knitr使ったけど,綺麗なhtmlできるのな.Rstudioちょっと見なおした.
> 186
ポイント,さんきゅ

200:132人目の素数さん
14/02/04 00:04:08.66 .net
真鍋●度は数学科だったんだな~

201:132人目の素数さん
14/02/05 16:42:31.84 .net
質問させてください
Basis splineで描画したグラフの任意の数値のy軸を求めることはできませんか?(下記


202:Basis splineのドキュメント) ttp://stat.ethz.ch/R-manual/R-patched/library/splines/html/bs.html 通常のspline補間では下記のサイトのようにやればpredictでx軸の数を指定すれば取得できたのですが ttp://d.hatena.ne.jp/hoxo_m/20110408/p1 Basis splineでの取得方法はないでしょうか 通常のspline補間のように指定したxの数を入力するとyを返してくれる方法が分かりません



203:132人目の素数さん
14/02/05 16:58:45.69 .net
すいません自己解決できました
お騒がせしました

204:132人目の素数さん
14/02/05 22:57:41.23 .net
質問があります。
環境はWindows7 32bitで、R3.0.1です。
RからC++のコードを呼びたいのですが、うまくいかないという話です。
C/C++コンパイラは、MinGW 4.8.1を入れて、RもMinGWも単体では問題無く動いています。

とりあえず、
--------------------
#include <vector>

extern "C" void test(double* a) {
std::vector<std::vector<double> > x(5);
}
--------------------
という何もしないファイルを、test.cppとして作って、Rcmd.exe SHLIB test.cppでコンパイルして、
さらに、Rから、
dyn.load("test.dll")
.C("test", arg1=as.double(c(1,2,3)))
dyn.unload("test.dll")
とかすると、問題無く実行できます。
(まあ何もしないですが。)

続きます。

205:197
14/02/05 22:58:34.64 .net
続きです。

でも、上のtest.cppを
--------------------
#include <vector>

extern "C" void test(double* a) {
std::vector<std::vector<double> > x(5);
std::vector<double> y(5);
}
--------------------
と変えてコンパイルして、Rから
dyn.load("test.dll")
dyn.unload("test.dll")
と実行すると、dyn.unloadのところでR毎エラーで止まってしまいます。
エラーメッセージは
Microsoft Visual C++ Runtime Library
This application has requested the Runtime to terminate it in an
unusual way.
Please contact the application's support tem for more information.
となぜか英語で出てきます。
メモリ管理周りが怪しい気がしますが、そもそも.Cでコードを実行していなくて、dllを
ロードしてアンロードしただけでエラーが出るのもわかりません。
だれが原因がわかるかたいませんか?

206:132人目の素数さん
14/02/06 09:50:21.68 .net
>>197
C++を使ったことがないので、
あまり価値のない情報だと思うが、
R 3.0.2 on Ubuntu 13.10で追試したところ、
x(5)のみのソースも、y(5)の行を足したソースも、
どちらも、エラーなし。
> dyn.load("test.so")
> .C("test", arg1=as.double(c(1,2,3)))
$arg1
[1] 1 2 3

> dyn.unload("test.so")
>

207:132人目の素数さん
14/02/06 22:02:51.67 .net
質問させてください
「data」+通し番号で150個存在するデータフレームがあるのですが
データを整形加工していくうちにデータ長が0になってしまったデータフレームをデータ長が1以上残っているものでリネームして通し番号を詰めていきたいのですが
地道に調べてやっていくしかないでしょうか
具体的には
data002がnrow(data002)=0の時、次にnrowでデータ長を調べて0じゃないものがdata003の時
nrow(data003)>0の時data002<-data003
data004とdata005のデータ長が0でdata006が0じゃないときはdata004<-data006といった具合に
のように代入して詰めたいです

208:132人目の素数さん
14/02/07 10:25:41.62 .net
>>200
自分なら次のようにします。
操作が面倒なので、150個のデータフレームを1つのリストオブジェクトにぶち込んで、
nrow()で判定して、削除。次に、連番を振りながら、個々のデータフレームを出力。
これで少なくとも見かけ上は「番号を詰めた」状態になります。

> a <- list(data002 = data.frame(x=1:10), data003 = data.frame(), data004 = data.frame(x=1:10))
簡単のために3つのデータフレームからなるリストで説明すると、
リストaの2番目の要素であるデータフレームの行が空になった状態。

> i <- sapply(a, function(x){nrow(x) != 0})
> a.truncated <- a[i]

これで、nrow()が0のデータフレームが削除されたリストができる。
Rでは、"["関数を積極的に利用した方が効率がよいと思う。
分かりやすいように2行に分けてたけど、
> a.truncated <- a[sapply(a, function(x){nrow(x) != 0})]
1行で十分。

リストから、個々のデータフレームに出力するにはassign()を使えばいい。
> for(i in seq_along(a.truncated)){assign(paste0("data", sprintf("%03d", i)), a.truncated[[i]])}
とすれば、data001, data002が出力される。

209:132人目の素数さん
14/02/07 11:52:16.93 .net
できました!
ありがとうございました!

210:132人目の素数さん
14/02/09 14:53:49.19 .net
Rをq()という関数で閉じようとするとき、
「workspaceを保存しますか。」というウィンドウが表示されます。
「いいえ」と答えて、そのまま閉じる過程まで、
スクリプトで指示することができますか?

211:132人目の素数さん
14/02/09 15:54:09.96 .net
>>203
さすがにこれはヘルプ見ろと叱られても仕方がないレベルでは?
?q

212:132人目の素数さん
14/02/09 16:31:07.01 .net
10日前にMacBook Pro 買って断然プログラム
モチ(マスター)ベーション
があがったよ

213:132人目の素数さん
14/02/09 18:02:24.94 .net
>>205
おめでとう*\(^o^)/*
Macは本物のUNIXマシンだから
数学やるには最適
頑張ってね

214:132人目の素数さん
14/02/09 18:04:33.54 .net
UNIXマシン?

215:132人目の素数さん
14/02/09 21:21:46.25 .net
UNIXを個人で使ってもあんまり意味ねえだろw
UNIXの発展系Cが本物のプログラム言語だから
いろいろな意味で最適
ならわかるがw

216:132人目の素数さん
14/02/10 03:32:55.67 .net
Macは邪悪なBSDと言われていて本物のUNIXじゃないよ。

パクリもののなんちゃってUNIX。

217:132人目の素数さん
14/02/10 04:10:41.30 .net
素人解説ww
OSXは正式にUNIX 03の商標を取得しているホンモノだよ。
UnixライクなOSとは別次元。

UNIX 03で個人が気軽に使えノートも有るのはMacだけ

218:132人目の素数さん
14/02/10 04:51:59.73 .net
OSの開発に失敗して、ソースパクっておいて自分だけ申請して自分こそが本物だと名乗る。

まさに詐欺師。

219:132人目の素数さん
14/02/10 17:06:47.17 .net
マカーは捏造ばっかりするから嫌われる。

220:132人目の素数さん
14/02/10 18:03:51.66 .net
繰り返し文わかる人いますか?
a1_1<-lm(x1_1~.,data_1)
a1_3<-lm(x1_2~.,data_1)
a1_5<-lm(x1_3~.,data_1)
  :
a1_43<-lm(x1_22~.,data_1)
a1_45<-lm(x1_23~.,data_1)
a1_47<-lm(x1_24~.,data_1)
a2_1<-lm(x2-1~.,data_2)
a2_3<-lm(x2-2~.,data_2)
a2_5<-lm(x2-3~.,data_2)
  :
a2_43<-lm(x2-22~.,data_2)
a2_45<-lm(x2-23~.,data_2)
a2_47<-lm(x2-24~.,data_2)
:
a12_1<-lm(x12_1~.,data_12)
a12_3<-lm(x12_2~.,data_12)
a12_5<-lm(x12_3~.,data_12)
  :
a12_43<-lm(x12_22~.,data_12)
a12_45<-lm(x12_23~.,data_12)
a12_47<-lm(x12_24~.,data_12)
このようにa12までを、くり返し文を使って短く表すことは出来ますか?
参考書を見てもわからなかったので、質問しました。

221:132人目の素数さん
14/02/10 18:57:31.58 .net
>>213
> くり返し文を使って短く表す
念のために確認しますが、「繰り返し文」は必須ですか?
繰り返し文を使わずに短くするのがルール違反なら、面倒くさいんだけど。。。

222:214
14/02/10 20:06:33.32 .net
反応ないけど、繰り返し文なしの一括化+マルチコア化を書いておこう。

説明を簡単にするために、デモデータをdata_1の分だけ作成。
data_2...data_12は今から説明するlapply()を入れ子にすればよい。

> data_1 <- data.frame(matrix(runif(100 * 47), 100))
> names(data_1) <- paste("x1", 1:47, sep = "_")

さて、先に式のリストを作成する。

> a <- sapply(paste0("x1_", 1:47, "~."), as.formula)

このaに対して、lmを実行すればよい。

> lapply(a, function(x){lm(x, data_1)})

ちなみに、multicoreパッケージを入れると、
> library(multicore)
> system.i lapply(a, function(x){lm(x, data_1)})
system.file system.time
> system.time(lapply(a, function(x){lm(x, data_1)}))
ユーザ システム 経過
0.398 0.001 0.399
> system.time(mclapply(a, function(x){lm(x, data_1)}))
ユーザ システム 経過
0.347 0.083 0.183
こんなに早くなる。

223:132人目の素数さん
14/02/10 20:09:54.63 .net
「> system.i lapply(a, function(x){lm(x, data_1)})
system.file system.time 」
↑ゴミが入ったorz

224:132人目の素数さん
14/02/11 00:00:16.50 .net
繰り返し分は使わなくて大丈夫です。
できました。ありがとうございました。
一括化とマルチコア化は勉強になりました。

225:132人目の素数さん
14/02/11 14:52:18.34 .net
商標とかそういうのじゃなくて、UNIXの精神を受け継いでいないよなMacは

226:132人目の素数さん
14/02/11 22:58:26.31 .net
Mac retina Pro 良いよ

227:132人目の素数さん
14/02/11 23:18:33.31 .net
>>218
じゃあ誰がUNIXの精神を引き継いでいるんだ?

アホはMacを使いこなせないだけ
ノータリンのミュージシャンでも
Macは使えるが、ちゃんとUNIXとして
使えば偽UNIX類とは別次元の完成度だな

228:132人目の素数さん
14/02/12 21:50:50.47 .net
Unixがアレだからなぁ。
マカーもずっとUnixの悪口言ってたのに
どの口でMacこそ本物のUNIXとか言ってるんだろう?

ほんとマカーは馬鹿だと思う。

229:132人目の素数さん
14/02/13 19:00:41.28 .net
windows Let's note
thinkpad
apple Mac ritena Pro

いろいろ便利だな~

230:132人目の素数さん
14/02/14 22:03:16.24 .net
【経営戦略】ビッグデータに死ねと言われた東急 山田祥平のRe:config.sys[14/02/14]
スレリンク(bizplus板)

Microsoftがとうとうきたかw
Power BI for Office 365でビッグデータ解析の民主化とはな

231:132人目の素数さん
14/02/14 23:39:53.27 .net
アホですな。そんな意見聞いてたら捏造コピペしまくるネトウヨの思うツボです。

232:132人目の素数さん
14/02/16 15:52:28.14 .net
plot3dで濃淡を指定ってできますかね?
scatterplot3dで図を作ったのですが動かせるようにしてくれと言われたので…

233:132人目の素数さん
14/02/16 16:55:53.07 .net
すいません。>>189をplot3dで濃淡表示したいのです。
ホームページを参考にして
color = rep( grey( c( length(Modern ):1 ) / length( Modern ) ) )
として
plot3d(x=l,y=a,z=b,col=color,size=8)としたら濃淡表示にはできるのですがmodernの数字と濃淡が一致しないのです…。
番号が小さいほど黒くしたいです。

234:132人目の素数さん
14/02/16 18:34:48.02 .net
>>226
濃淡(明度)と彩度と色相は独立なので、いまいち意味が分からないが、
君の言う「濃淡」とは、グレー階調のこと?
それなら、
grey(Modern / max(Modern))
とか、
grey(1 - Modern / max(Modern))
じゃないの?番号が小さい方を濃くしたいなら、前者か。

> color = rep( grey( c( length(Modern ):1 ) / length( Modern ) ) )
意味不明。特にrep()。
c( length(Modern ):1 )はc()を使う必要なし、( length(Modern ):1 ) でOK
> Modern <- sample(3, 10000000, TRUE)
> system.time(c( length(Modern ):1 ))
ユーザ システム 経過
0.154 0.052 0.359
> system.time(( length(Modern ):1 ))
ユーザ システム 経過
0.020 0.001 0.022
c()で激遅になる。

235:132人目の素数さん
14/02/16 18:50:03.22 .net
ありがとうございます。
R初心者で分厚い本とHPを参考にしながら只今奮闘中です^^;
右も左もわからない自分にとってここのサイトはとても助かります!!

236:132人目の素数さん
14/02/16 19:06:06.58 .net
連投すいません
グレー階調を行った場合一番高い数字は白になりますか?

237:132人目の素数さん
14/02/16 19:18:51.27 .net
>>229
> grey(1)
[1] "#FFFFFF"
> grey(0)
[1] "#000000"

1を代入したら白ですね

238:132人目の素数さん
14/02/16 19:25:01.37 .net
ありがとうございます。
なんとか白が見えるようにならないでしょうか?
背景色をかえれるかなと思ってコマンドを打ってみたのですが変わらなくて…
Modernの数値を変えたらいいのでしょうか?

239:132人目の素数さん
14/02/16 19:32:11.72 .net
背景色変えられました!
bg3dではなくbgと打ってました…

240:132人目の素数さん
14/02/21 17:50:49.16 .net
>>185
Emacs に不可能はない
C-c C-v b or C-c C-v C-b org-babel-execute-buffer

241:132人目の素数さん
14/02/22 14:58:46.83 .net
質問です。optimizeでパラメーターを求めたいのですがエラーが出てしまい、出来ません。

X<-c(1,2,3,4,5,6,7,8,9,12,13,24)

T<-length(X) #データ数
q<-3 #次数
eps<-X #diff(log(X))#収益率

ty<-function(alpha,omega){
for( t in 1:T){

alpha[1]
alpha[2]
alpha[3]
omega

for( j in 1:q ){
AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
A<-(log(omega+AA)^2)*(-1/2)
print(eps[abs(t+3-j)])
}
}
}

optimize(c(2,1,2,3),ty, maximum=TRUE)

242:132人目の素数さん
14/02/22 15:50:55.18 .net
目的関数がよくわからん
何を最適化したいのかな
あとoptimizeは1変数じゃなかったっけ、optimのほうがいいかも
あとAAの初期値がいるかな

243:132人目の素数さん
14/02/22 16:03:21.43 .net
Aを目的関数にしてみた

X<-c(1,2,3,4,5,6,7,8,9,12,13,24)

T<-length(X) #データ数
q<-3 #次数
eps<-X #diff(log(X))#収益率
AA<-0 #initial

ty<-function(par){
for( t in 1:T){

alpha<-c(par[1],par[2],par[3])
omega<-par[4]

for( j in 1:q ){
AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
A<-(log(omega+AA)^2)*(-1/2)
#print(eps[abs(t+3-j)])
return(A)
}
}
}
opt.Nelder<-optim(c(2,1,2,3),ty,control=list(fnscale=-1,maxit=200000,
trace=TRUE),method="Nelder-Mead")

opt.BFGS<-optim(c(2,1,2,3),ty,control=list(fnscale=-1,maxit=200000,
trace=TRUE),method="BFGS")

244:132人目の素数さん
14/02/22 16:06:35.40 .net
なんか変だな、ナシで

245:132人目の素数さん
14/02/22 16:11:09.60 .net
>>234
>AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
これはepsの長さ超えるぞ

246:132人目の素数さん
14/02/23 02:23:09.17 .net
234です。皆様ご教授ありがとうございます。

>>235
目的関数はAAです。オメガ、アルファを求めたいです。
optimで実行した際にエラーが出てしまい、optimizeで実行しろと表示されてしまったため、optimizeを使っています。

やりたい事は、ARCHモデルの対数尤度関数を表示したく、練習として3次のARCHモデルの対数尤度関数に近いものを作りました。
>>234
確かにepsの長さが超えてますね。ご指摘ありがとうございます。
自己回帰なので過去の値に戻りたいのですが...勉強します。

247:132人目の素数さん
14/02/23 02:25:18.09 .net
>>234ではなく
>>238

248:132人目の素数さん
14/02/23 08:31:12.95 .net
受験勉強の合間に
息抜きで作業してるとMacBook Pro13インチが小さく感じるな・・・
15インチかiMac 2□インチが必要な気が・・・

249:132人目の素数さん
14/02/23 08:38:03.42 .net
老眼か?
いったい何浪してるんだよ

250:132人目の素数さん
14/02/24 06:16:12.29 .net
>>242 勘弁してよ~

251:132人目の素数さん
14/02/25 17:06:50.33 .net
質問です。
optim関数を実行した際に、「


252:初期パラメータで関数を表示出来ません」とエラーが出てしまいます。 関数の式は間違ってないと思うのですが、原因がわからないため、ご教授お願いいたします。 コードはこちらです。 sai <- function(x) { T<-length(x); q<-3; eps<-diff(log(x)) ts.plot(eps) Mean <- mean(x); Var <- var(x); S = 1e-6 parm <- c(0.1,0.1*Var ) archsai<-function(par){ for( t in 2:T){ alpha<-c(par[1]) omega<-par[2]  if(t<=1){ htt<-omega }else { htt <- (omega+alpha[1]*eps[t-1]^2) ht <- sqrt(htt) A <- -(log(htt))^2*(1/2) B <- -(((eps[t])^2)/htt)*(1/2) ln <- A+B   } } return(ln) } optim(parm,archsai,control = list(fnscale=-1) ) }



253:132人目の素数さん
14/02/25 21:18:55.66 .net
>>244
この前の人かな?xは前のXでいいのかな?

>B <- -(((eps[t])^2)/htt)*(1/2)
ここt-1じゃないのか

254:132人目の素数さん
14/02/25 21:32:07.00 .net
>>245
そうです。236の際はお世話になりました。
xは前のXで大丈夫です。

ありがとうございます。無事に出来ました。

255:132人目の素数さん
14/02/25 21:34:35.44 .net
236ではなく、234ですね。

256:132人目の素数さん
14/02/25 21:36:48.35 .net
>>246
そうかそうか。一応言っておくけどhttが負になってsqrt()でwarnings()出てるよ
何か制約条件があれば追加したほうがいいかな

257:132人目の素数さん
14/02/25 22:29:08.17 .net
>>248

ご丁寧にありがとうございます。
条件つける事で無事解決しました。

258:132人目の素数さん
14/02/25 22:57:04.23 .net
明日の16時39分頃に気をつけて下さい。
日本にも世界にも巨大地震が起きませんように。
皆さんも一緒に祈って下さい。

太陽フレアのXが発生しました。
太陽黒点数の100越えが24日間継続しているようです。

259:132人目の素数さん
14/03/12 20:18:06.86 .net
library(foreign)
yield <- read.dta("URLリンク(www.stata-press.com))
tx <- with(yield, interaction(fertilizer, irrigation))
amod <- aov(yield ~ tx, data=yield)
library(agricolae)
HSD.test(amod, "tx", group=TRUE)

これをちゃんと動作させることって出来ますか?結果が出てきません。どこかミスしているんでしょうか?
ちなみにyield.dtaは表です。

260:132人目の素数さん
14/03/13 09:31:48.35 .net
>>251
動作しないとは具体的にどういうこと?
> HSD.test(amod, "tx", group=TRUE, console = TRUE)

Study: amod ~ "tx"

HSD Test for yield

Mean Square Error: 24.93463

tx, means

yield std r Min Max
1.0 36.91257 5.335857 20 25.54710 46.60105
[snip]
5.1 44.55313 4.663802 20 31.20605 51.55704

alpha: 0.05 ; Df Error: 190
Critical Value of Studentized Range: 4.527912

Honestly Significant Difference: 5.055736

Means with the same letter are not significantly different.

Groups, Treatments and means
a 2.1 51.18
ab 4.1 50.75
[snip]

261:132人目の素数さん
14/03/13 18:35:25.07 .net
pre_vecB<- c(1,2,3,4,0)
#pre_vecB<- c(0,0)
out_vecB<-mean(pre_vecB[pre_vecB!=0])

0があれば、0を除いて平均を求める。
0しかなければ、NAを返す。(NAN)でない。
というスクリプトを書きたいのですが、スマートな書き方ありますでしょうか?

262:132人目の素数さん
14/03/13 19:36:48.92 .net
>>253
スマートかどうか分からんが、自分ならこうする。
ifelse(is.nan(a <- mean(pre_vecB[pre_vecB != 0])), NA, a)

263:132人目の素数さん
14/03/13 19:42:46.86 .net
>>252
ありがとうございます。結果が表示されるようになりました。ってconsole=TRUEが抜けてただけでした。
申し訳ありませんでした。R初心者にも門戸を開いて頂きありがとうございました。
私は分散分析、回帰分析がRで出来るようになれればなーと思っているところです。
SPSSからの移行です。頑張って精進します。

264:132人目の素数さん
14/03/14 22:43:43.25 .net
>>254
ありがとうございました。参考にさせてください。

265:132人目の素数さん
14/03/15 17:52:29.30 .net
均一分散の仮定をせずにWhiteの推定量で回帰するにはどうしたらいいの?
普通にlmじゃ無理?

266:132人目の素数さん
14/03/15 18:09:43.39 .net
>>257
> RSiteSearch("heteroscedasticity white")
これでcarパッケージのhccm関数やrmsパッケージのrobcov関数にたどり着くよ

267:132人目の素数さん
14/03/20 19:50:08.95 .net
> x<- seq(1,20,2)
> x
[1] 1 3 5 7 9 11 13 15 17 19

こういったベクトルがあって、このベクトルの後ろからN個の要素
を抜き出したいです。

Nが4なら
13 15 17 19
と返したいです。どのように書けばよろしいでしょうか?

268:132人目の素数さん
14/03/20 21:15:45.46 .net
tail(x,4)

269:132人目の素数さん
14/03/21 22:49:16.51 .net
>>260
ありがとうございます。そのまんまの関数ですね。
知らなかった。

270:132人目の素数さん
14/03/22 15:00:41.16 .net
0が含まれれば0を除外して平均を求める。0しかなければNAを返す。
というサンプルです。
これを実際に運用してみると、単に平均を求めるスクリプトに比べ大変時間が
掛かることに気づきました。
webで調べてみると、ifelse文を使うと遅くなるという記事をみかけます。
同じ意味で、早く稼働するスクリプトがありましたら教えてください。


#vecA<- c(0,0,0)
vecA<- c(1,3,0)
ifelse(is.nan(a<- mean(vecA[vecA!=0])),NA,a)

ifelse(is.na(b1<-median(pre_listB[pre_listB!=0])),0,b1)

271:132人目の素数さん
14/03/24 13:51:22.64 .net
あぁ、本当だねぇ。ifelseにするとifよりも遅くなるねぇ。
ifelseを提示したのは、そちらの方が分かりやすいと思ったから。
すまなかったねぇ。
> system.time(sapply(1:1000, function(x){vecA = c(1, 3, 0); ifelse(is.nan(a <- mean(vecA[vecA != 0])), NA, a)}))
ユーザ システム 経過
0.042 0.000 0.059
> system.time(sapply(1:1000, function(x){vecA = c(1, 3, 0); if(is.nan(a <- mean(vecA[vecA != 0]))){mean(a)}else{NA}}))
ユーザ システム 経過
0.023 0.000 0.029

272:132人目の素数さん
14/03/25 15:18:11.06 .net
>>263
ありがとうございます。ifelse文がわかりやすかったから大変勉強に
なりました。
実装データの量が多くてどうしたもんだかと悩んでたもので、
新たなスクリプト助かります。
自分は基本Cを書いてますが、Rの文が摩訶不思議に思えてしまいます。
system.time()の使い方も初めて知りました。ありがとうございました。

273:132人目の素数さん
14/03/25 17:43:35.11 .net
>>264
Cの人から見たらRは摩訶不思議かも知れないけど、
変態言語のPerlよりもずっとまし。

274:132人目の素数さん
14/03/26 23:24:54.38 .net
id <-c(1,2,3,4,5)
sex <-c("F","F","M","M","M")
height<- c(180,192,170,175,180)
weight<- c(50,65,60,55,70)
(MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height))

上のようなデータフレームがあるとします。

ここでid=3の行データを以下のように変更(差し替え)したいとするとき、
ID = 3;
SEX = "F"
HEIGHT =150
WEIGHT =55

どう書けばいいでしょうか?

275:132人目の素数さん
14/03/27 09:58:04.57 .net
>>266
>(MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height))
じゃなくて、
> (MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height, WEIGHT = weight))
だよね。で、date.frameのrow向きの差し替えは、べたな方法しかないと思うよ。
どこかのパッケージに当該機能を有する便利な関数があるのかもしれないが。
> MYDATA[3, ] <- list(ID = 3, SEX = "F", HEIGHT = 150, WEIGHT = 55)
> MYDATA
ID SEX HEIGHT WEIGHT
1 1 F 180 50
2 2 F 192 65
3 3 F 150 55
4 4 M 175 55
5 5 M 180 70

276:267
14/03/27 10:10:01.03 .net
気になって試行錯誤をしたら、順番が正しければ変数名は省略できるようだ。
> MYDATA[3, ] <- list(3, "F", 150, 55)
ただし、変数名があってもなくても、順番を間違えると、期待通りの結果を得られないから要注意。
また、変更箇所が多ければ、edit()を使うことを勧める。
うちは、
> Sys.getenv("EDITOR")
[1] "vi"
だけど、使い慣れたテキストエディタを設定しておいた方がよいだろう。
viのキーバインドを知らなかったら、混乱すると思う。

277:132人目の素数さん
14/03/27 15:38:26.02 .net
>>267
ありがとうございます。WEIGHT忘れてました。
list()と、MYDATA[,]でデータフレームのリスト要素を変更できるの
ですね。
これを使えば、変更(差し替え)だけでなく、列を追加するのにも
同じやり方なので便利ですね。

edit()の使い方もありがとうございました。

278:132人目の素数さん
14/03/27 16:23:23.60 .net
>>269
お役に立ったようで、どうも。
行(row)や列(col)の追加は、もっと簡単でrbind()やcbind()を使います。

列の場合は
MYDATA$新変数 <- runif(5)
とかでも、MYDATAデータフレームの中に新しく「新変数」が作成されます。

# RjpwikiのQ&Aで質問が放置されていたので回答したけど、
# 河童さんはやっぱりggplotが嫌いなんだな。

279:132人目の素数さん
14/03/28 15:07:08.25 .net
普通のプログラムでは、0割するとクラッシュしてしまうから、
事前に0割を避ける条件文を作らなくてはいけないんだけど。
Rでは、Infが返ってくるだけなのだから、(クラッシュしない)
答を求めて、Infが出たときに対応の処理をさせてもいいですよね。

プログラムとして0割に対して特に対応しなくてもいいですかね。

280:132人目の素数さん
14/03/28 15:32:41.65 .net
>>271
そんなのプログラムによる話で、一般化できない。

281:132人目の素数さん
14/03/29 10:39:15.46 .net
>>271
まともな統計ソフトならみな対応してるよ

282:132人目の素数さん
14/03/29 11:28:09.36 .net
>>273
エ、エクセルとか(震え声)

283:132人目の素数さん
14/03/29 11:53:57.77 .net
Excelは表計算ソフトでしょ。
アドインは発注品だし、マイクロソフトは統計ソフト作っているわけじゃないし。
アドインの酷さは検索すれば出てくるよ。

284:132人目の素数さん
14/03/30 18:10:19.21 .net
Perlの小飼弾は天才
UCB

285:132人目の素数さん
14/03/31 13:39:43.19 .net
河童さんは関西人だったのか。
東京の人はチャーリー浜なんて知らないよね。

286:132人目の素数さん
14/04/02 07:56:27.99 .net
Mac版だと--interactiveという起動オプションがありますが、
Windows版だとこれではなく、変わりに--essという起動オプションがあります
この2つのオプションの挙動に何か違いはありますか?
VimShellの:VemShellInteractiveで呼んでいるのですが、現状違いはないように
思えて、オプション名が違う理由がよくわかりません

287:132人目の素数さん
14/04/02 08:50:54.70 .net
オプションが名が違うのは別のオプションだからです。以上。

288:132人目の素数さん
14/04/02 17:15:20.26 .net
>>278
>VimShell
初めて聞いた。便利そうだけど、所詮、ESSには勝てないと思う

289:132人目の素数さん
14/05/13 09:43:49.49 .net
>>281
スルー検定�


290:ヘ全員合格か。素晴らしい。 ExtraTrees法なら、extraTreesパッケージかな。



291:132人目の素数さん
14/05/15 01:39:45.15 .net
writewebGLで保存した図をパワーポイントに図として乗せたいのですが動かせる形でパワーポイント上に図として乗せるにはどうすればいいでしょうか?

292:132人目の素数さん
14/05/15 04:49:00.39 .net
Livewebってやつのpptアドインがあるみたいだけど上手く行かんな

293:132人目の素数さん
14/05/18 12:35:30.99 .net
グラフをアスキーアートで書くとか
フレームバッファに書くとか
できますか?

294:132人目の素数さん
14/07/07 23:56:58.21 +w/piBrtZ
初心者です。
例えば、次のような構文をRで繰り返し文などを使って
短くするやり方が知りたいです。

x1<-test[c(1:100),c(2),]
x2<-test[c(1:100),c(3),]
x3<-test[c(1:100),c(4),]
     :
     :
x100<-test[c(1:100),c(101),]
わかる人いたら教えてもらえればありがたいです。

295:132人目の素数さん
14/07/10 01:22:22.72 .net
ThreeWayパッケージのT3って三相因子分析のことなのでしょうか?

296:132人目の素数さん
14/07/10 11:45:59.03 .net
>>286
何でマニュアルを読まないの?
T3: Interactive Tucker3 analysis
Description: Detects the underlying structure of a three-way array according to the Tucker3 (T3) model.

とりあえず、下記を読んだら?
P. Giordani, H.A.L. Kiers, M.A. Del Ferraro (2014). Three-way component analysis using the R
package ThreeWay. Journal of Statistical Software 57(7):1–23.

L.R Tucker (1966). Some mathematical notes on three-mode factor analysis.
Psychometrika 31:279–311

297:132人目の素数さん
14/07/10 12:37:38.03 .net
ありがとうございます。
PCAUSP(超行列の主成分分析?)でcomponentの数の決定を行うと思うのですがここでのcomponentはそれぞれのモード?の因子数を選択しているのでしょうか?
よろしくお願いします。

298:132人目の素数さん
14/07/10 21:38:56.05 .net
皆様は画像はpdfで出していますか?

299:132人目の素数さん
14/07/11 08:44:05.68 .net
アスキーアートでも出せますか?

300:132人目の素数さん
14/07/11 09:19:39.76 .net
なぜにアスキーアートにこだわるのか分からないけど
出せるかどうかということならあなたがそういう関数を自作すれば出せる
現状でそういう機能を持ったライブラリが存在するかということなら恐らく存在しない
理由はアスキーアートでは現実的な精度のグラフを書くことが難しいから

301:132人目の素数さん
14/07/11 09:23:59.91 .net
csoundっていうソフトでは出せますよ?
そのソフトが使っているライブラリーわかりますか?

302:132人目の素数さん
14/07/11 09:35:10.86 .net
ここはRのスレだからなぁ
そのソフトのスレに行って聞くといいんじゃないかなー

303:132人目の素数さん
14/07/11 09:49:47.17 .net
URLリンク(1.bp.blogspot.com)
この画像が証拠です。
csoundも何かのライブラリーを使って書いていると思うのでそのライブラリーを探してください。
そうしたらRのデータを出力すればこれができると思います。

304:132人目の素数さん
14/07/11 18:18:34.17 .net
>>289
LaTeX用に出力するときはpdfだけど、
普段使いには、X11()かquartz()でしょ。
なぜ、いちいち全てをpdfに出力しなくてはならないのだ。

>>290,292,294
aalibを入れて、Rから呼び出せばよいのでは?
色つきならlibcacaで。
仕事なら(対価を支払ってくれるなら)、
ここにデモコードを貼るけど、
そうではないなら自分で頑張れ。

305:132人目の素数さん
14/07/22 22:48:50.15 .net
>>33
これですが、自己解決しました。
setwd(readline())
パスコピペ
で、できます

306:132人目の素数さん
14/08/07 17:43:38.30 BlsuHsdRJ
>>285
自己解決しました。

307:132人目の素数さん
14/08/27 01:38:55.66 .net
機械学習のスレってどこの板にある?

308:132人目の素数さん
14/08/27 01:40:55.49 .net
>>298
自己解決しました。

309:132人目の素数さん
14/08/28 00:28:03.88 .net
>>292
linux なら

ldd `which csound`

でリンクしてるダイナミックライブラリの一覧表示できるよ。

310:132人目の素数さん
14/08/28 12:38:48.01 .net
>>300
そいつに触るなよ。
何を助言しても意味をなさないよ。

311:132人目の素数さん
14/08/28 19:43:48.09 .net
>>301
了解!

312:132人目の素数さん
14/09/08 23:10:31.20 .net
質問させてください。

Rにはすでにdatasetsが入っていて、すぐ解析出来ると聞いています。
いくつか試したいのですが、datasetsの名前や内容を紹介しているサイトはあっても、属性や変数の数などを記載しているサイトが見つかりません。

もしくは、datasetsの属性などを一覧表示できるコードがあると助かるのですが…

どなたかご助力いただけませんでしょうか?

313:132人目の素数さん
14/09/08 23:27:22.65 .net
>>303
R datasets
でネット検索するのが良いのでは?

datasetsパッケージのなかにはいってるものの一覧
URLリンク(stat.ethz.ch)

クリックすればデータの素性は英語だけど説明あるよ。

サイズはdimとかNROWとかNCOLとかheadとかを使えば簡単に調べれるよ。

datasetsのなかにはいってるものの一覧をループでまわしてこれらの関数をつかって調べたいものを表にするのは簡単だと思います。

だれかがまとめて表にしてくれてそうだから上の検索キーワードでもっと探したらありそう。

314:132人目の素数さん
14/09/09 00:07:42.25 .net
>>303
ヘルプをみるべし

315:132人目の素数さん
14/09/09 00:10:14.26 .net
>>304
丁寧にありがとう!
2chに書き込むの初めてだったから、きついこと言われると思ってヒヤヒヤしてたよ
原始的だけどdatasetsの名前をベクトルとして作って、headとかdimとかを使ってみる

R始めたばっかで右往左往しとるけど、先が見えてきて良かった

316:132人目の素数さん
14/09/09 00:14:05.67 .net
>>305
なんとか自動化出来ないかと思いまして…
一個一個手入力でもいいんですが、もしかしたらスマートな方法があるかと思い質問していまいました。すみません。

317:132人目の素数さん
14/09/09 00:30:31.35 .net
なにをどう自動化したいのかイマイチつかめないけどデータセット自体の説明なら
ヘルプをデータセット名で検索すれば項目の説明とか出てくるよという意味ですよ

318:132人目の素数さん
14/09/09 01:08:30.81 .net
>>308 さんを擁護したげよう。
俺が上の検索方法を書いたんだけど
あの画面ってヘルプ画面だし。

help.start()

でヘルプを起動するとブラウザがたちあがる。
パッケージにdatasetsがあるなら、パッケージを選択して datasets をみると
ほぼ同じの画面になる。(バージョンが異なってたら差があるかも。)

319:302
14/09/09 01:37:25.01 .net
お騒がせしてしまったようですみません。50個ほどのdatasetsについて、headやnrowとかを使ってdatasets名を手入力して調べてました。
str(AirPassengers),str(BJsales),...,
nrow(AirPassengers),str(BJsales),...

さすがにこれを全てのdatasetsについてやるのはしんどいので…
datasets名の手入力をなくす方法を模索してたわけですが…
どうも下記サイトに答えがあったようです。\\(.*\\)といった呪文があって、理解するのには時間かかりそうですがもうちょっと調べてみます。
URLリンク(qiita.com)

320:302
14/09/09 01:38:30.58 .net
すみません。誤植がありました。
お騒がせしてしまったようですみません。50個ほどのdatasetsについて、headやnrowとかを使ってdatasets名を手入力して調べてました。
str(AirPassengers),str(BJsales),...,
nrow(AirPassengers),nrow(BJsales),...

さすがにこれを全てのdatasetsについてやるのはしんどいので…
datasets名の手入力をなくす方法を模索してたわけですが…
どうも下記サイトに答えがあったようです。\\(.*\\)といった呪文があって、理解するのには時間かかりそうですがもうちょっと調べてみます。
URLリンク(qiita.com)

321:132人目の素数さん
14/09/09 02:22:11.83 .net
>>311
いいこと教えてくれてありがとう。

Itemをstrsplitで" "で区切って1番目の要素を名前にして

pasteとparseと命令を作成してevalしてやれば半自動で命令実行できる。

他の方法としては、csvファイルで保存してもっとテキスト処理が得意なRubyとかPerlとかPythonで処理して
Rで実行できる命令に整形するとか。

for ループでまわすと自動で str(..) NROW(...)を実行できるよ。
strじゃなくてcolnamesでデータの名前を取得した方が良いかも。

322:132人目の素数さん
14/09/09 06:50:00.06 .net
sapplyでよいのでは?

323:132人目の素数さん
14/09/09 07:32:42.83 .net
>>311
正規表現を「呪文」と表現すると言うことはITの基本的な知識が全くないに近い。
Rを使うのはこの先かなり大変かも。
学生なら情報処理入門のような講義を受けた方がよいかも。

324:302
14/09/09 11:36:26.39 .net
ご指摘の通り学生です。生物系の専攻ですが研究で必要になりました。
ひとまず基本情報技術者試験の本を見ながら知識を身につけてみます。

325:132人目の素数さん
14/09/09 15:04:20.46 .net
情報系の講義ははっきり言って無駄だ。
俺の経験からすると。
Youtubeのチュートリアルとか本家のサイトとか
正規表現なら「正規表現 入門」とか「正規表現 最速マスター」とかでヒットしたサイトで勉強した方がよい。
大学の講義って自分のペースにあってないし終るまで半年とかかかるし効率悪すぎる。

326:132人目の素数さん
14/09/09 15:06:05.11 .net
よっぽど評判良いなら受講しても良いとは思うけど
先生とか内容によるから。
Rの講座とかあるなら受けてみる価値はあるかもしれないけど。
正規表現って理系の研究室あまり重視してないっぽいしな
数値計算とかを重視してそう。

情報の基礎講座うけてうんざりした記憶がある。

327:132人目の素数さん
14/09/09 15:09:56.22 .net
重視してないもなにも、適当にマニュアル読んで分からないなら死ねっていう扱いなだけだろ
当然そうだわな

328:132人目の素数さん
14/09/09 16:43:00.21 .net
マニュアルなんぞ
必要箇所以外読まんだろ。

機能確認したら俺の環境だとhelp.start()でブラウザたちあげて
datasetsのhtmlページみれなくなってた。
これって異常?

329:132人目の素数さん
14/09/09 21:44:33.06 .net
>>319
異常だよ。
> library(help = "datasets")
はちゃんと出力される?

330:132人目の素数さん
14/09/10 00:14:13.44 .net
>>320
回答ありがとう。

library(help = "datasets")
は表示されるけど

help.start() してパッケージのdatasetsをみると以下の
文字がブラウザに表示されてる。

No package index found for package datasets

なんでだろ?
ローカルに install.packages()で入れたパッケージのヘルプは見れるんだけどな。
root権限でインストールしたパッケージのヘルプが見れなくなってる。
baseパッケージヘルプもブラウザでみれない。

library(help=base)

はちゃんと表示されるんだけど。
設定がちゃんとできてないのかな?

331:132人目の素数さん
14/09/10 00:25:12.38 .net
原因わかりました。
パッケージを入れないとそれらのパッケージのhtmlファイルがはいってないみたい。
Debian Linuxをつかってるんだけど。

r-base-html

ってパッケージを入れたら多分表示される。

332:132人目の素数さん
14/09/10 00:27:51.48 .net
いま入れてみたそのパッケージ。
ちゃんと表示されるようになりました。
いつもネット検索して調べて�


333:スから気付かなかった。



334:132人目の素数さん
14/09/28 22:34:11.15 .net
Rcmdrの使い方について分かりやすく解説されたサイトや成書はありますか?

335:132人目の素数さん
14/09/28 22:42:09.57 .net
>>324
群馬大学の大学院の研究室のサイトにあったよ
教授の名前忘れてもうた!・

336:132人目の素数さん
14/09/28 23:08:16.53 .net
>>324
「「R」 Commander ハンドブック」は? ちょっと古いけど

>>325
群馬大学なら青木先生だと思うけど

337:132人目の素数さん
14/09/29 00:11:16.55 .net
>>325
>>326
ありがとうございます!

338:132人目の素数さん
14/09/29 18:36:49.59 .net
Rcmdrなんて使うくらいならJSTATなり市販ソフト使えよ
Rは、中身わかんないけどとにかく結果だけ欲しい、って人向けじゃない

339:132人目の素数さん
14/09/29 20:29:26.25 .net
>>328
いやいや、誰もwelcomeだよ。
使いたい人が使えばいい。その自由がOSSのよさだよ。
中身は分からないけどとにかく「無料で」結果だけが欲しい人であっても。

Rcmdrを使いたい人は、Rcmdrを入り口にして、普通のRコンソールを使うようになればいい。

340:132人目の素数さん
14/09/30 03:01:32.77 .net
いいよそういう奇麗ごとは

341:132人目の素数さん
14/10/01 05:17:22.65 .net
数学的センス&多倍長プログラムを組める方望む
RSA Numbers 素因数分解に挑む・解析数式の考察
URLリンク(blog.livedoor.jp)

342:132人目の素数さん
14/10/02 22:04:00.84 .net
>>331
馬鹿が他人をタダ働きさせようとするブログにしか見えない。

343:132人目の素数さん
14/10/05 16:17:38.45 MmE0F3xV8
Revolution Rって使ってる人います?
学術用途(学割?)なら申請したら無料みたいなんだけど、登録フォーム書いた後返信メールが来ない・・・

344:132人目の素数さん
14/10/06 17:26:37.81 .net
dはデータフレームで、1列目(V1)にクラスを表わす文字列、他の列はその特徴量が入ってます
library(kernlab)で読み込んだ状態です
> set.seed(0)
> ksvm(V1~.,d)  (ここがksvm(d$V1~.,d)も同じ)

> set.seed(0)
> ksvm(d[,1]~.,d)
で結果が変わります。下の方は誤分類率0%となり不自然?で、正しいのは上のV1を使うほうなのでしょうが、なぜ結果が変わるのかがわかりません。
どなたか詳しい方教えてください

> str(d)
'data.frame': 512 obs. of 3 variables:
$ V1: Factor w/ 4 levels "a","b","c","d": 1 1 1 1 1 1 1 1 1 1 ...
$ V2: num 0 0 0 0 0 0 0 0 0 0 ...
$ V3: num 0 0 0 0 0 0 0 0 0 0 ...

345:132人目の素数さん
14/10/06 18:10:51.17 .net
kernlabは知らないけどlm()だと正しくformulaを渡せないね。

> formula(lm(V1 ~ ., d))
V1 ~ V2 + V3
> formula(lm(d$V1 ~ ., d))
d$V1 ~ V2 + V3
> formula(lm(d[,1] ~ ., d))
d[, 1] ~ V1 + V2 + V3

同じようなことになってるんじゃない?

346:132人目の素数さん
14/10/06 19:48:33.22 .net
>>335
formulaって関数は使えなくて実際にやってみられてないんですけど
その「V1 ~ V2 + V3」というのは、「クラスV2、V3を使って(dから)V1を予測しよう」という意味で、それをformulaに渡せているということですかね
URLリンク(d.hatena.ne.jp)
d[,1]~.でダメだったのは、d[,1]という定数を指定したために変数からV1を除外できていない(V1も予測するために使う変数として考えられていた)
予測する対象はd[,1]にV1読んだのと同様に順番・値がそろっていて、分類を予測するときはクラスそのものであるV1を使うので、誤分類率0%となってるわけですか

文が長くなってすみません。結構考えてたんですが、質問してみてよかったです。同時に、予兆はあったのに情けないです。
答えていただきありがとうございました。

347:132人目の素数さん
14/10/08 13:41:57.34 .net
ThreeWayパッケージのCP関数を実行した場合寄与率に当たる個所はどこになるのでしょうか。
よろしくお願いいたします。

348:132人目の素数さん
14/10/08 14:23:51.23 .net
連投すいません。
PCA of MEANを実行した際に固有値とfitが出てきたのでfitが累積寄与率になるのではないかと解釈しております。
この解釈で良いのでしょうか。
よろしくお願いいたします。

349:132人目の素数さん
14/10/09 02:19:56.75 .net
質問させてください。
例えば、100×100の行列のデータがあったとして、11から40列の各行の数字を掛け算した
1×100の行列を作成するにはどのように記述すれば宜しいでしょうか。

350:132人目の素数さん
14/10/09 03:09:36.05 .net
apply(A[,11:40],1,prod)
これでダメかな

351:132人目の素数さん
14/10/10 00:20:16.58 .net
>>340さん
ありがとうございました!

もう一つ質問なのですが、文字列を含むcsvファイルを読み込みました。
数字しか入っていない列も文字列として認識されてしまっているのですが、
数字しか入っていない列を切り取って、これを数字形式に変換するにはどうすればよいでしょうか。

352:338
14/10/10 00:33:16.71 .net
as.numeric(a$b)
でどうかしらん?

あとはリード.シーエスヴィーのオプションをちゃんとしていする方法もあるわよん

353:132人目の素数さん
14/10/10 00:46:11.72 .net
>>342さん

ありがとうございます。
が、初心者なので具体的にどうすればよいかまだ分かりません。
例えばread.csvのオプションは銅のように設定すればよいのでしょうか。

354:132人目の素数さん
14/10/10 01:25:24.12 .net
>>341
>数字しか入っていない列も文字列として認識され
数字以外のものが混入しているパターンとエスパー
例えば、半角空白は文字であって数字ではない。
表計算ソフトじゃ無くてテキストエディタでcsvの中を確認しては?

355:342
14/10/10 01:45:15.16 .net
追記。
例えば、
$ echo -e "x1,x2¥n11,A¥n22,B¥n' ',C¥n33,D" > test.csv
$ cat test.csv
x1,x2
11,A
22,B
' ',C
33,D
というcsvファイルがあったとして、
> read.csv("test.csv")
x1 x2
1 11 A
2 22 B
3 ' ' C
4 33 D
> class(read.csv("test.csv")$x1)
[1] "factor"
というように、数値型にならずに因子型になる。
表計算ソフトではx1の3番目は空白なので見えない。

356:132人目の素数さん
14/10/10 02:04:46.33 .net
再現できるcsvくれ

357:132人目の素数さん
14/10/10 10:54:24.22 .net
>>338
どうもPCA pf MEANは2相の主成分分析の様です。
CPfuncで計算されるfitにあたるものが累積寄与率にあたるものなのでしょうか?

358:132人目の素数さん
14/10/11 21:18:27.38 .net
質問です。データフレームの列名の一部を変更したいのですがどのように操作すれば宜しいでしょうか。
よろしくお願いします。

359:132人目の素数さん
14/10/11 21:28:06.62 .net
>>348
> (dat <- data.frame(x = 1:3, y = month.name[1:3], z = LETTERS[1:3]))
x y z
1 1 January A
2 2 February B
3 3 March C
というデータフレームがあったとして、
yをhogeに替えるなら、
> names(dat)[2] <- "hoge"
> dat
x hoge z
1 1 January A
2 2 February B
3 3 March C
例では1つの列名だけだが、もちろん、複数の列名を同時に替えることもできる。

360:132人目の素数さん
14/10/12 09:52:52.95 .net
>>349さん
ありがとうございます!

もう一つ質問させてください。
例えば以下のようなデータフレームがあったとします。
data1、data2、data3、・・・

下の繰り返し処理の中で、ループの中でdata1、data2、・・・のデータフレーム
を読み込みたいのですが、どのように記述すればよいのでしょうか。

#for (i in 1:5) {



361: } 下記のように記述したのですがうまくいきませんでした。 (pastedateにはdata1という名前のデータが入ってしまい、以前に入ってたデータは消えてしまっているようです。) pastedate <- paste("data",i,", sep = "") sumdata<-rbind(XXXXX,pastedate) よろしくお願いします。



362:132人目の素数さん
14/10/12 10:51:17.99 .net
>>350
いまいち状況が分からない。
data1, data2, ...をファイルから読み込みたいのか、
それとも、単に既存のデータフレーム(data1, data2, ...)をrbindで連結したいのか。

後者なら、
> data1 <- data2 <- data3 <- data.frame(x = runif(3))
というデータフレームがあったとして、
> alldata <- lapply(paste0("data", 1:3), get)
という感じでリスト化して、
> Reduce(rbind, alldata)
とすれば結合できる。
他にも、いろいろな連結方法があると思うけど、
自分は、シリーズになっているデータフレームは常にリスト化して運用するので、
do.call()やReduce()で連結している。

363:132人目の素数さん
14/10/13 19:28:38.06 .net
## S4 method for signature 'formula'
ksvm(x, data = NULL, ..., subset, na.action = na.omit, scaled = TRUE)

ってヘルプに書いてあったのに、xがformulaのときここに出てない引数を使えるんですけどどうしてですか?
一つ和訳がわからなかったのですが、...(説明:additional parameters for the low level fitting function)が関係あるんでしょうか

364:132人目の素数さん
14/10/13 22:19:35.86 .net
>>352
引数「...」は下請け関数にそのまま渡す引数。
kvsm()は直接使わないけど、
下請け関数が使う引数を指定できますよという意味。
もし「...」がなければ、kvsm()が指定した引数以外を指定するとエラーになる。
例えば、
> f <- function(x = 1){return(x)}
という関数を定義して実行すると、
> f()
[1] 1
となるが、x以外を指定するとエラーになる。
> f(y = 2)
以下にエラー f(y = 2) : 使われていない引数 (y = 2)

でも「...」を追加するとエラーにならない。
> f <- function(x = 1, ...){return(x)}
> f(y = 2)
[1] 1

365:132人目の素数さん
14/10/14 00:34:29.21 .net
>>353
なるほど。
たとえば
「ksvm(x,data=y,cross=n)」→分析結果(分類法、誤分類率、n重交差確認法による誤分類率)
 (「ksvm(x,data=y)」(xはyの列の内クラスを表わす列を指す)→分析結果(分類法、誤分類率))
というようにヘルプの形式に明示してないけど使えたcrossは、総称的関数ksvmからこの時呼ばれた下請け関数に渡され、使われたのですね
すっきりしましたありがとう!

366:132人目の素数さん
14/10/14 23:54:05.52 .net
テキストファイルから、Rのデータフレームに格納することを考えています。

例えば2014年10月10日の血液検査のデータが
WBC 4900, RBC 470, Plt 47.3, ALT 32, CRP 7.2, AdV -, Ur.WBC 3+
このようなテキストデータで与えられたとします。
これを読み込んでデータフレームに次のように格納するにはどのようにすればよいでしょうか。
data.frame(20141010, WBC)=4900, data.frame(20141010, RBC)=470, .........
Rだけでやるより、ほかの言語で読み込んで、Rに渡す方がいいでしょうか。
その後で、そのデータフレームからopen office calcのworksheetの相当するセルに値を入れることを考えています。そこはR4Calcでできるかと考えているのですが。アドバイスお願いし

367:132人目の素数さん
14/10/15 01:33:53.41 .net
>>355
お、同業者が来た。

そのままcsvとして読み込んで、データを分離しちゃえば?
2行のtmp.csvがあったとして、
> (a <- read.csv("/tmp/tmp.csv", header = FALSE))
V1 V2 V3 V4 V5 V6 V7
1 WBC 4900 RBC 470 Plt 47.3 ALT 32 CRP 7.2 AdV - Ur.WBC 3+
2 WBC 4900 RBC 470 Plt 47.3 ALT 32 CRP 7.2 AdV - Ur.WBC 3+
とdata.frameにする。変な空白が混入したので前処理。空白が混入しなければ不要。
> library(stringr)
> (b <- t(apply(a, 1, str_trim)))
V1 V2 V3 V4 V5 V6 V7
[1,] "WBC 4900" "RBC 470" "Plt 47.3" "ALT 32" "CRP 7.2" "AdV -" "Ur.WBC 3+"
[2,] "WBC 4900" "RBC 470" "Plt 47.3" "ALT 32" "CRP 7.2" "AdV -" "Ur.WBC 3+"
さて、次にstrsplit()で分離して、必要なところだけを回収する。
> sapply(apply(b, 2, strsplit, split = " "), function(x){sapply(x, function(y){y[2]})})
V1 V2 V3 V4 V5 V6 V7
[1,] "4900" "470" "47.3" "32" "7.2" "-" "3+"
[2,] "4900" "470" "47.3" "32" "7.2" "-" "3+"


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch