【R言語】統計解析フリーソフトR 第5章【GNU R】at MATH
【R言語】統計解析フリーソフトR 第5章【GNU R】 - 暇つぶし2ch2:132人目の素数さん
13/09/26 13:08:40.45 .net
●過去スレ
= 統計解析フリーソフト R =
スレリンク(math板)
URLリンク(mimizun.com)
= 統計解析フリーソフト R 【第2章】 =
スレリンク(math板)
URLリンク(mimizun.com)
統計解析フリーソフト R 【第3章】
スレリンク(math板)
URLリンク(mimizun.com)
【R言語】統計解析フリーソフトR 第4章【GNU R】
スレリンク(math板)

3:132人目の素数さん
13/09/26 19:29:05.38 .net
>>1
乙。前スレが落ちたの >>989 付近?

4:132人目の素数さん
13/09/28 14:07:33.74 .net
見れば分かるだろ。

5:132人目の素数さん
13/09/29 11:02:05.99 .net
Rコマンダーのカスタマイズについての質問です。
判別的中率の計算の途中で
次のようなコマンドを実行したいのですが、

hanbetsu.result <- table(データセット$朝食有無, データセット$予測群)

↓これ、だとうまくいきません。
doItAndPrint(paste("hanbetsu.result <- table(",ActiveDataSet(),"$",tclvalue(lhsVariable),",",ActiveDataSet(),"$予測群)" sep=""))

,(コンマ)をペーストするにはどうしたらいいのでしょうか?

6:132人目の素数さん
13/09/30 13:03:24.56 .net
>>5
Rcmdrはまったく分からないんだけど、

> ,(コンマ)をペーストするにはどうしたらいいのでしょうか?
","で合っているよ。うまくいかない原因は別にあると思うよ。

いずれにせよ、読んでいる人が再現できるものを提示しないと、
誰も助言できないよ。
特に、GUIな人は、トラブルを全て「うまくいきません」ですませてしまって、
読んでいる側は意味不明。←他人からは解決する気がないと判断される

あと、いちいちsep=""と書くのは面倒ではありませんか?
私はpaste0()を使います。

7:132人目の素数さん
13/10/01 00:18:59.84 .net
うまくいきました。
うまくいったのはこちらです。

doItAndPrint(paste("hanbetsu <- table(", ActiveDataSet(), "$", tclvalue(lhsVariable), ",", ActiveDataSet(), "$予測群)", sep=""))

コンマの後の空白をきちんと空けたのが良かったようです。ありがとうございました。

8:132人目の素数さん
13/10/01 09:42:04.68 .net
>>7
> コンマの後の空白をきちんと空けたのが良かった
違うと思う。 >>5 はsepの前にあるべきコンマが抜けていたから。

9:132人目の素数さん
13/10/01 21:53:45.05 .net
>>8
比較するとそうですね。
ありがとうございます。勉強になりました。

10:132人目の素数さん
13/10/12 18:44:10.94 .net
実にどうでもいい話かもしれませんが、RってTeXみたいに書き方の規定ありますか?
フォントとか配置とかそういう感じの

11:あのこうちやんは始皇帝だった
13/10/12 19:13:14.79 .net
コイツら、無職の、女性恐怖症の、ゴミ・クズ・カス・無能・虫けらのクソガキども!

 無職のクソガキども!  大変なコトになるな!

憲法改正だ! 96条を改正してから、9条を改正する。 そして、何条を改正するか?
18条だ! そうして、国家総動員法ができて、オマエたち、無職のクソガキどもは、真っ先に徴兵だ!
オマエたちは、頭デッカチの虚弱児・ひ弱だから、最下等兵! すぐ戦死だ!

アハハハハハハハハハハ!!!!!!!!!!!!!!!!!!!!

 死にゆく、クソガキどもに、大伴家持の詩を贈ってやろう!

海行かば 水浸く屍 山行かば 草むす屍 大君の 辺にこそ死なめ かえりみはせじ!

12:壊の国の狢 ◆yEy4lYsULH68
13/10/12 19:15:20.36 .net
>>11


13:132人目の素数さん
13/10/13 11:32:28.63 .net
>>10
質問の意味が分からないぞ。
TeXの書き方(ソースの書き方なら全くの自由だ)の規定と、
フォントの配置(TDSのことか?)がどう関係があるの?

Rのコーディング作法なら、Googleが提唱しているものがある。
URLリンク(google-styleguide.googlecode.com)

また、作法通りに整形し直してくれるパッケージもある。

14:10
13/10/13 11:55:33.09 .net
>>13
すいません確かに意味不明でした



15:章中に「TeX」と書くときは「全部大文字でEはTより下で・・・が本当の表記だけど出来ないならしょうがないからTeXと書くように」とか決まっていたと思います Rも同様に書式の決まりがありますか? というのも、文章で「R」ただ1字を書くとどうも可読性が悪い気がしてしまって、何かいい方法はないかと・・・フォントくらい変えた方がいいかと悩み中です



16:132人目の素数さん
13/10/13 12:48:58.90 .net
>>14
全く文意をくみ取れていなかったようだorz

&yen;TeX{}のR版を探しているといことだよね。
R界隈の論文を見れば分かると思うけど、*ない*です。
journal of statistical softwareのLaTeXクラスファイルに定義されていた気もするが、
標準化されていない。

スライドなど少々の遊びが許される場合で、Rの可読性を高めるたいなら、
「全ての解析は&yen;includegraphic[with=1.5zw]{Rlogo-4.png} ver.3.01で行いました。」
などと、ロゴを使えばどうか。
URLリンク(developer.r-project.org)

17:10
13/10/13 13:16:07.80 .net
>>15
なるほど、ロゴを使うというのは盲点でした
今度試してみます
ありがとうございました

18:132人目の素数さん
13/10/22 20:02:55.39 .net
積み立て棒グラフ出したいんだけど行列の要素にマイナスの値はいってるとちゃんと
表示されなくておかしくなる。そういうものなの?

19:132人目の素数さん
13/10/22 20:35:19.99 .net
>>17
おかしくなるも何も、負の値を含む積み上げって、
どういう図を期待しているんだ。

> barplot(matrix(c(1:3, -1, 4:5),3))
予想通りの図になるが、これがおかしいということ?

20:132人目の素数さん
13/10/22 21:02:15.43 .net
>>18
サンクスwそのグラフで俺の頭がおかしかった事に気がついたw

21:132人目の素数さん
13/10/25 00:01:31.53 .net
Rコマンドー

22:132人目の素数さん
13/10/27 23:06:08.31 .net
これでMC法使えるオススメのマニュアル(書籍)紹介して下さい。

23:132人目の素数さん
13/10/28 05:58:06.04 .net
アメリカサマータイムにできないんだけど。なんで?もとからないのか?
ヨーロッパサマータイムあるのに意味分からん。

24:132人目の素数さん
13/10/28 06:58:08.95 .net
あっできた。
EDT指定してもできなかったがAmerica/New_Yorkにしたらできたわ。イミフだわ。

25:132人目の素数さん
13/10/28 09:18:36.85 .net
>>21
MC法が何か勉強してから、もう1度来なさい。
URLリンク(ebsa.ism.ac.jp)

>>22-23
意味不明。POSIXt()の引数が期待通りでなかったってこと?
New YorkならEST5EDTじゃないの?

26:132人目の素数さん
13/10/28 11:13:49.49 .net
>>24
引数にEDT入れたらそんなのありませんって言われたw
EST5EDTって入れればいいのかな?まぁ"America/New_York"って入れたらできたから解決したけど。
ちなみにBSTイギリス夏時間もだめだった。でもWET西ヨーロッパ夏時間はちゃんと認識した。
できたりできなかったりよくわからんわ。

27:132人目の素数さん
13/10/31 08:57:31.37 .net
変数A,B,C,D,Eがあるデータを2グループや3グループに可能な限り均等に分けたいんですが、
層別ランダム割付という手法があるというところまでは調べられました。
Rでランダム割付が可能と聞いたのですが、やり方を解説しているサイトなどありませんか?
またはご存知の方いらっしやいませんか?

28:132人目の素数さん
13/10/31 21:11:36.63 .net
>>26
Stratified Randomizationって、実際にはBlock Randomizationの方法で実現するわけだから、
Block Randomizationのパッケージblockrandを使えばよいと思うよ。
URLリンク(cran.r-project.org)
オレは使ったことがないけどね:-p

29:27
13/10/31 21:28:55.98 .net
追記。

cranの中を探したら、他にもいろいろあるみたいだ。
全文検索システムのnamazuでいろいろと検索してみてください。
URLリンク(search.r-project.org)

あと、↓充実した説明で助かるね!
URLリンク(en.wikipedia.org)

30:132人目の素数さん
13/11/09 14:18:52.90 .net
ARモデルのAICに関する質問です。
ar(データ)
データ$aic
では、相対的なAICの値しか表示されないため、最適な次数はわかってもAICの値がわかりません。
また、arima(データ, order=c(x,0,0))
で行うと定数項が含まれているため純粋なARモデルのAICを求める事が出来ません。
ARモデルのAICを求める方法、教えてください。

31:132人目の素数さん
13/11/09 15:32:47.80 .net
>>29
> ar(lh)$aic
0 1 2 3 4 5 6
18.3066645 0.9956542 0.5380214 0.0000000 1.4903597 3.2127890 4.9932119
7 8 9 10 11 12 13
6.4694960 8.4625678 8.7411958 10.7408834 12.5338637 14.4847850 16.4617958
14 15 16
18.0437158 17.4398358 19.3449467
> library(timsac)
> unimar(lh)$aic
[1] -34.34604 -46.87367 -47.40513 -46.86175 -44.86637 -43.20116 -41.34344
[8] -40.37922 -38.39713 -41.00437 -39.38885 -37.39977 -35.53922 -33.63709

32:132人目の素数さん
13/11/09 16:34:03.27 .net
>>30
ありがとうございます。
無事できました。

33:132人目の素数さん
13/11/10 17:33:34.06 .net
Rの教科書で一番オススメなのはなんでしょうか?

34:132人目の素数さん
13/11/10 19:25:09.00 .net
windowsのエクスプローラーからディレクトリの場所をコピペすると、
例えば(E:\R)となりこのままではsetwd("E:\R")と行うことができません。
いつもはsetwd("E:\\R")やsetwd("E:/R")に手で修正しています。
何かもっと簡単な方法はないでしょうか?

35:132人目の素数さん
13/11/11 00:01:41.40 .net
>>33
Windowsをやめると幸せになれます
>>32
人による。
なお、コーディングはひたすら他人のコードを読むのが上達の近道。

36:132人目の素数さん
13/11/11 09:34:32.91 .net
>>33
"E:\R"を"E:\\R"や"E:/R"に自動置換してsetwd()に渡すオレ様関数を書けばよいのでは。

my.setwd <- function(p) setwd(nomalizePath(p))

こんな感じかな。こちらはWindowsじゃないので未検証。

ちなみに、文化の違いだと思うけど、
私は、対象ディレクトリに移動して、
ごにょごにょ作業や確認をしてからRを起動するので、
setwd()が必要な場面に出会わない。

37:132人目の素数さん
13/11/11 18:55:03.91 .net
>>32
何をやりたいかによる。
しかし確実に言えるのは、日本人(含在日)の本は全てダメ。

38:132人目の素数さん
13/11/11 22:23:05.34 .net
>>36
文系で、あまり高度でない実験結果や計量分析のまとめなど、普通はSPSSとかでやる人が多いことをRでやるばあいは?

39:132人目の素数さん
13/11/12 00:05:48.49 .net
>>37
Excel使ってろよ

40:132人目の素数さん
13/11/12 00:30:43.01 .net
かまってちゃん登場

41:132人目の素数さん
13/11/12 08:17:12.09 .net
R in Action や著者のページをまず読んで、
R Cookbook (邦訳あり)で忘れたことを参照したり、
R Graphics Cookbook でグラフの書き方を学んだら?

あとは、reshape や plyr の使い方を作者の論文で勉強しておくと便利

42:132人目の素数さん
13/11/12 09:08:54.40 .net
>>40
> R in Action
おぉ、これは初めて知った。
講義に使えそう。

43:132人目の素数さん
13/11/13 21:18:08.57 .net
ENTERを押すと次のグラフが表示されるようなときに、そのグラフ全部を並べて表示するにはどうしたらいいですか?

44:132人目の素数さん
13/11/13 23:09:37.07 .net
>>42
par(mfrow=c(5,5))

45:132人目の素数さん
13/11/14 00:27:16.43 .net
>>43
plot(~~)を何度もする場合は確かにそれでなりますが、今は一回のplot(~~)で
「クリックまたはENTERキーを押すと次のページに移ります」って出て
エンターを押すたびに次のグラフがプロットされるようなものなので出来ません。

46:132人目の素数さん
13/11/14 06:22:47.17 .net
par(ask=TRUE)

47:132人目の素数さん
13/11/14 09:56:30.46 .net
なんかおかしな。
ask=TRUEになっていても、mfrow=c(1,1)でなければ、
一度に描画されると思うが。

>>44は何か勘違いをしていないか。
具体的に再現できるコードを示して。

48:132人目の素数さん
13/11/14 10:20:09.41 .net
例えば
library(vars)
data(Canada)
plot(VAR(Canada))
などです。

49:132人目の素数さん
13/11/14 10:40:11.97 .net
>>47
どんだけ特殊なケースを持ち出すんだよ。
plot.varest()って、ここまで変態な関数にはびっくりだ。
vars:::plot.varest を見たら分かると思うけど、layout()を使っている時点で、
mfrowで制御できないし、

if (nv > 1)
par(ask = TRUE)

ってハードコーディングされているから、関数のオプションでどうにかなるものでもない。
結論は、あきらめろ。

50:132人目の素数さん
13/11/14 12:26:28.31 .net
>>48
なるほど
難しいことはわかりませんがどうにもならないということだけはわかりました
別々に保存して並べて貼るぐらいで我慢します
ありがとうございます

51:132人目の素数さん
13/11/14 12:38:30.96 .net
>>49
厳密に言うと、どうにもならないこともないんだけど、
必要な労力は、その目的にペイしないと思う。

pdf(file="hoge.pdf")
plot(VAR(Canada))
dev.off()
ってして、3ページになっているhoge.pdfをぐりぐりスクロールして見るのはだめなの?
3つをきちんと並べて1枚の図にしなくてはいけないの?

52:132人目の素数さん
13/11/14 23:29:34.23 .net
文字列”123,456,789.123”を数値に変換するにはどうすれば良いのでしょうか?
一つの場合はカンマを取って変換を行えば良いとわかるのですが、
文字列の数が200あるのといくつかの文字列の小数点の位置が僅かに異なるため、効率よく行う方法が知りたいです。

53:132人目の素数さん
13/11/14 23:56:07.42 .net
>>51
それ専用の関数を見たことがあるが、どのパッケージだったか覚えていない。
5000パッケージなんて数が増えすぎ。

まぁ、普通に置換すれば良いと思うが。
> a <- "123,456,789.123"
> options(digits = 15)
> as.numeric(gsub(',','',a))
[1] 123456789.123

54:132人目の素数さん
13/11/15 00:04:31.57 .net
>>52だが、誤解されるかも知れないので、
先回りするが、文字列の数がいくつあろうが、
小数点の位置が異なろうが、>>52の提案はそのまま通用する。
> A <- rep(a, 10)
> A[5] <- paste0(A[5], "4")
> A[6] <- "9.1"
> A
[1] "123,456,789.123" "123,456,789.123" "123,456,789.123" "123,456,789.123"
[5] "123,456,789.1234" "9.1" "123,456,789.123" "123,456,789.123"
[9] "123,456,789.123" "123,456,789.123"
> as.numeric(gsub(",","",A))
[1] 123456789.1230 123456789.1230 123456789.1230 123456789.1230 123456789.1234
[6] 9.1000 123456789.1230 123456789.1230 123456789.1230 123456789.1230

55:132人目の素数さん
13/11/15 00:54:39.62 .net
>>50
あぁこれは確かに楽でなかなかいい感じだなー
管理するにしてもこっちの方がよさそう

56:132人目の素数さん
13/11/15 00:55:31.21 .net
>>53
ご丁寧にありがとうございます。
無事できました。

57:狸 ◆BvcplLXSGo
13/11/15 01:55:03.29 .net


○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○
○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●
●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○●○

58:132人目の素数さん
13/11/18 05:16:45.18 .net
SEXPなんていやらしい型なんだ。

59:132人目の素数さん
13/11/18 14:19:17.46 .net
>>57
そんな小中学生みたいな反応は好きにすればよいが、
REXPじゃなくて何でSEXPなんだろうかと疑問に思ったまま幾数年。

60:132人目の素数さん
13/11/19 23:40:18.38 .net
とあるアプリのC言語のDLLから、Rとデータのやり取りをしたいのですが、
難易度は高いですか?というかできますか?

61:132人目の素数さん
13/11/20 01:21:25.57 .net
>>59
出来ます。
難易度は人によりますが、
そのような質問をする人には無理だと思います。

62:132人目の素数さん
13/11/20 12:44:19.25 .net
>>60
ありがとう。できることがわかれば、時間をかければなんとか、、。

63:132人目の素数さん
13/11/20 14:01:24.55 .net
>>61
やる気があるなら、ヒントを追加。
読むべきドキュメント: URLリンク(cran.r-project.org)

手順としては、そのDLLとRを仲介するインターフェイスをCで書く。
その際、>>57 の型を使う。
たぶん、20-50行程度ですむような気がする。
MinGWを含むRtoolsをインストールして、書いたCソースをコンパイル。
Rから、インターフェイスをロードして、使えるかどうかチェック。
デバッグしながら、Cソースを直して、再度チェック、その繰り返し。

64:132人目の素数さん
13/11/20 23:38:43.40 .net
すみません
tmp <- sample(1:150, 100)

のtmpって何を表してるんですか?
参考書のどこにも説明がなくて困ってます

65:132人目の素数さん
13/11/21 10:16:15.79 .net
>>63
何を表しているのかという問いに対する答えはRオブジェクトです。
tmpという文字列はRオブジェクトにつける名前で、
ユーザが任意に決めます。

66:132人目の素数さん
13/11/21 23:52:37.83 .net
>>62
ヒントありがとうございました。MinGWですか、、VC++で無理目だったらMinGWでアタックしてみます。
時間はあるんで、いろいろ勉強していきます。

67:132人目の素数さん
13/11/26 21:31:29.06 .net
メモリが足らんが高くて買う気しない

68:132人目の素数さん
13/12/10 07:27:48.64 .net
例えば
result <- lm(Sepal.Length ~ ., data=iris)
とでもして、result$coefficientsを取り出したいとき、
result$coe
でも出ちゃうんですが、この補完機能(?)は切れないのでしょうか?
ちょっとスペルが足りなくてもエラーがでないのでいつか問題が起きそうな気が
してしまうのですが、それとも心配しすぎでしょうか

69:132人目の素数さん
13/12/10 09:41:58.44 .net
>>67
逆に、プログラムの内部で、
result$coefficientsの代わりにresult$coeとコーディングしているものがあれば、
プログラムが動かなくなるけど、そういう副作用はいいの?

一意の場合は省略可能というルールがある限り、そのルールでRが動いているのだから、
それでよいのでは?

70:132人目の素数さん
13/12/11 01:32:30.36 .net
データ・サイエンスのプログラミング言語はRからPythonに置き換わる
URLリンク(readwrite.jp)

71:132人目の素数さん
13/12/11 07:27:37.57 .net
そんな主張への反論だそうだ。こちらは訳されないだろうが。
URLリンク(blogs.computerworld.com)
URLリンク(blog.revolutionanalytics.com)

72:132人目の素数さん
13/12/11 10:31:49.73 .net
k-meansクラスタリングで質問があります
クラスタリングベクトルを出した後、その結果を元のデータフレームに結合して
それをもとに条件抽出し該当データフレームを抽出したいのですが、クラスタリングベクトルの数値を条件にすることはできないのでしょうか
たとえば、
SEX HEIGHT WEIGHT
1 F 158 51
2 F 162 55
3 M 177 72
4 M 173 57
5 M 166 64
とあったとき
SEX HEIGHT WEIGHT CLUSTER
1 F 158 51 1
2 F 162 55 2
3 M 177 72 3
4 M 173 57 3
5 M 166 64 2
というように結合してCLUSTERの数値をもとに抽出を行いたいです

73:132人目の素数さん
13/12/11 11:19:27.24 .net
>>69
両方使ってるけどね

74:132人目の素数さん
13/12/11 16:01:23.35 .net
>>71
> (a <- data.frame(sex=factor(c("F","F","M","M","M")), height=c(158,162,177,173,166), weight=c(51,55,72,57,64)))
sex height weight
1 F 158 51
2 F 162 55
3 M 177 72
4 M 173 57
5 M 166 64
> a$sex <- as.numeric(a$sex)
> cl <- kmeans(as.matrix(a), 3)
> (b <- cbind(a, cluster=cl$cluster))
sex height weight cluster
1 1 158 51 1
2 1 162 55 1
3 2 177 72 2
4 2 173 57 3
5 2 166 64 3

3だけ抽出
> b[b$cluster == 3, ]
sex height weight cluster
4 2 173 57 3
5 2 166 64 3

こういうこと?ちなみに、cbind()で結合する必要はないよ。

75:132人目の素数さん
13/12/14 16:20:31.15 .net
R使ってる人って分析前のデータ整形もRでやろうとするけど、これって効率的なのか?
整形はExcelでやって、統計解析だけRを使うのは異端なのか?

76:132人目の素数さん
13/12/14 16:28:21.09 .net
整形は自分で別途バッチを組むな

77:132人目の素数さん
13/12/14 19:08:13.08 .net
SQLじゃね?

78:132人目の素数さん
13/12/14 21:05:34.56 .net
>>74
そんなことはないし、Excelでも何でも使えるなら使えば良いと思う。
でも、世の中のデータはそんな単純なデータばかりじゃない。

79:132人目の素数さん
13/12/14 23:12:19.65 .net
>>74

RExcelとか使うでしょ。

他にも
「RとRubyによるデータ解析入門」とか
「R&JavaScriptによるデータ解析と視覚化テクニック」
とか言う本が出ているくらいだから、お察し。


ただ、最近は、R使わずに全部Pythonでやっちゃえとかいう Python好きが居て、
それはそれでうっとおしい。

80:132人目の素数さん
13/12/15 00:21:48.74 .net
>>74 >>78
コマンド一つで処理できれば言語はどうでもいい。適当なのを使えばいいだけ。

81:132人目の素数さん
13/12/15 01:35:28.58 .net
>>78
俺のことか?

82:132人目の素数さん
13/12/19 15:45:13.08 .net
平均値の95%の信頼区間の下限値を数値として、取り出したいのだけど。
t.test()だと、T検定の平均値ほかいくつもの結果が表示される。
他のプログラムからRの計算結果(信頼区間の下限値)だけを取り出したいのだが。
良い方法ありますか?

83:132人目の素数さん
13/12/19 16:11:17.73 .net
>>81
よく分からないな。
信頼区間の下限値を取り出せばよいのでは?
例えば、t.test()はhtestクラスのlistを返す。そのlistにはconf.intという名前の要素があり、
それは数値ベクトル(要素数は2)だ。その1つめの要素が下限。

他のプログラムって何?javaやpythonなど専用のインファーフェイスがあるよ。
探してみれば?
パイプで渡したいなら、パイプで渡せば良い。
パイプで渡すならこんな感じ?
$ Rscript -e 't.test(1:100)$conf.int[1]' |sed 's/¥[.¥]//g'
44.74349

84:132人目の素数さん
13/12/19 18:57:49.90 .net
$conf.int[2]
をつけて解決しました。
ありがとうございます。

他のプログラムというのは、CのDLLです。Rccpを利用するか悩みどころです。

85:132人目の素数さん
13/12/19 19:33:06.33 .net
>>83
それ、下限じゃなくて上限では?

> 他のプログラムというのは、CのDLLです。Rccpを利用するか悩みどころです。
またしても意味不明瞭。よく分からないな。
Rの中からCプログラムを呼び出すのか、Cプログラムの中でRを呼び出したいのか。
なぜ、exeじゃなくてdllと言うのか。「CのDLL」という表現ならWindows限定なのか。
Windows限定ならRと通信する方法がもっと別にあるのじゃないだろうか。

86:132人目の素数さん
13/12/19 23:40:49.36 .net
>それ、下限じゃなくて上限では?
すいません。$conf.int[1]で下限ですね。
>またしても意味不明瞭。よく分からないな。
>Rの中からCプログラムを呼び出すのか、Cプログラムの中でRを呼び出したいのか。
Cプログラムの中でRを呼び出したいです。

これはきちんと説明せねば。少し長くなりますが、、
MT4という為替取引(いわゆるFX)を支援するアプリがあり、
このアプリには自由に取引のアルゴリズムを作れるよう独自のプログラム作成機能があります。
その言語がC言語に似たmqlと呼ばれるものです。
通常は、mqlファイルを専用のコンパイラでコンパイルしてMT4で実行します。
ただ、MT4で実行されるものはメモリや実行速度において弱い部分があり、
その為、MT4に利用できる.dllをC言語などで作成し、dll上でアルゴリズム計算をさせMT4に返す
という方法をとる人もいます。というか自分がそういう状態です。

MT4(mql) → my.dll
記述的にはmqlファイルにmy.dllをimportさせます。

このdllから、Rに対して統計的な計算をさせその結果を得たいと思案して先の質問となりました。
t.test()で表示される内容は解っていたのですが、そこから数値だけをどうすれば返すのか、わからなかったのです。

87:132人目の素数さん
13/12/19 23:42:24.49 .net
当方は、直接dllからRに対して計算をさせその結果を返す方法を知りません。
どうやら、Rcppを使えば良いかも?というレベルです。
ただし、MT4において、mt4R.dllというフリーのライブラリがあり、それを用いると
簡単な記述でMT4とRを連携させることができます。それは当方も確認済みです。
下のような流れです。
MT4(mql) → mt4R.dll → R
さて、自分は my.dllを作成していますが、mt4R.dllを利用してRを計算するには、
MT4(mql) → my.dll → MT4(mql) → mt4R.dll → R
という手順を踏まないといけません。MT4(mql) ⇔ my.dllとの配列の扱いも実は面倒な仕様があり、できれば
MT4(mql) → my.dll → R
のように直接my.dllからRを呼び出し計算させその答えが得たらいいなと思います。
とりあえず、t.test()から知りたい統計結果だけをとりだせたのでまずは一歩すすみました。
Rcppを持ちいるほかに良い方法があるようでしたら、教えてくだされば幸いです。

88:132人目の素数さん
13/12/20 00:14:58.57 .net
書き忘れました。MT4はWindowsで動作できるアプリです。

89:132人目の素数さん
13/12/20 00:41:08.46 .net
URLリンク(cran.r-project.org)
このあたりを読むか、
RCOMのようなものを使うか
URLリンク(sunsite.univie.ac.at)

90:132人目の素数さん
13/12/20 11:49:32.67 .net
ありがとうございます。
よく読んで参考にさせていただきます。

91:132人目の素数さん
13/12/20 17:05:17.55 .net
参考にするってのは何もしないという意味の枕詞

92:132人目の素数さん
13/12/20 17:10:08.26 .net
一理あるw

93:132人目の素数さん
13/12/21 10:17:02.43 .net
>>90
参考になる意見だな

94:132人目の素数さん
13/12/22 19:47:07.69 .net
すみません、このサイトナノデスの
URLリンク(d.hatena.ne.jp)

kabu_data_close = as.ts( scan( "/home/yuta/work/R/kabu/data/kabu_ar_training_close.txt" ) )
ar_predict_result <- matrix()
arima_predict_result <- matrix()
j <- 1
for( i in 123:136) {
training_kabu_data <- kabu_data_close[1:i]

#ARModel
ar_data_close <- ar( training_kabu_data )
ar_predict_close <- predict( ar_data_close, n.ahead = 1 )

#ARIMAModel
arima_data_close <- arima( training_kabu_data, order=c(1,0,1) )
arima_predict_close <- predict( arima_data_close, n.ahead = i )

ar_predict_result[j] <- ar_predict_close$pred[1]
arima_predict_result[j] <- arima_predict_close$pred[1]

j <- j+1
}

scanでよみこんだtxtはデータの数が123こあります。なのにfor文は123:136で
<- kabu_data_close[1:i]となっています。123以降はkabu_data_closeには入ってないのではないのでしょうか??


というか違うデータでですがError in na.fail.default(as.ts(x)) : missing values in object
とでます

95:132人目の素数さん
13/12/22 21:29:08.90 .net
>>93
エスパー募集ですか?
さすがに、kabu_data_closeの構造を秘密にされたら答えようがない。
str()ぐらい示そうよ

ちなみに、
> hoge <- as.ts(1:100)
> str(hoge)
Time-Series [1:100] from 1 to 100: 1 2 3 4 5 6 7 8 9 10 ...
> hoge[101:110]
[1] NA NA NA NA NA NA NA NA NA NA
という仕様。

96:132人目の素数さん
13/12/22 23:07:53.72 .net
>>94
返信ありがとうございます。
>>93のkabu_data_closeとは違いますが

> kabu_data_close = as.ts( scan( "C:/Users/root/Documents/kabu_ar_training_close.txt" ) )
Read 120 items
> ar_predict_result <- matrix()
> arima_predict_result <- matrix()
> j <- 1
> for( i in 120:133) {
+
+ training_kabu_data <- kabu_data_close[1:i]
以下同文

Error in na.fail.default(as.ts(x)) : missing values in object

> str(kabu_data_close)
Time-Series [1:120] from 1 to 120: 10688 10599 10508 10579 10653 ...

とでます

97:93
13/12/23 00:09:31.23 .net
>>93のサイトのままなのでコードはかえないでいいはずなのですが
したいことは一回一回学習して予測することです。

+  j <- j+1
kabu_data_close[i+1]<-ar_predict_result[j]

}
を加えてみましたが
Error in `[<-.ts`(`*tmp*`, i, value = NA_real_) :
only replacement of elements is allowed
とでます。

98:93
13/12/23 01:17:20.89 .net
すみません。解決しましたmm;;
サイトのコメント欄に同じ質問がありました。。。

99:132人目の素数さん
13/12/23 07:48:48.61 .net
>>97

そういうときは、どういう風に解決したかをまとめて、ここにも貼るものでしょ!

100:132人目の素数さん
13/12/23 08:53:02.60 .net
普通は回帰係数を求める時っていろんな説明変数を試すものなのに、
株価予測は株価だけしか使わないのが当たり前になってるのが不思議。

101:93
13/12/23 09:00:50.98 .net
>>98
普通にfor文の136までのデータを使ってるようでした;;
技術的な問題じゃないので申し訳ないのですが

予測するデータは2012年7月以降、学習データは2012-01-04~予測の前日
このサイトの流れから予測の前日というのが7月の前日まで
と勘違いしていました。;

102:132人目の素数さん
13/12/23 09:37:21.10 .net
自分には何を言ってるのか分からんが、本人が分かったならそれでいいのでは?

103:132人目の素数さん
13/12/23 10:59:31.69 .net
>>101
scan()するデータがそもそも間違っていたのに、
思い込みが原因で混乱していましたってことだろ(違うかもしれんが)。
最小のサンプルデータも提示せず、まさしく「エスパー募集」だったてことだ。

104:132人目の素数さん
13/12/23 12:14:20.03 .net
Error in arima(training_kabu_data, order = c(1, 0, 1)) :
non-stationary AR part from CSS
In addition: Warning messages:
1: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
2: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
3: In arima(training_kabu_data, order = c(1, 0, 1)) :
possible convergence problem: optim gave code = 1
すみません。このエラーってどうゆう意味でしょうか;;

105:132人目の素数さん
14/01/07 14:10:27.54 .net
Rを用いたパネル分析(ランダム効果モデル)におけるエラーについて
Rを用いて、パネル分析を行ったのですが、
「 以下にエラー swar(object, data, effect) :
the estimated variance of the individual effect is negative」
というエラーが出てきます。

どのような対処を行えば、エラーを解消することが可能でしょうか。

106:132人目の素数さん
14/01/07 14:47:31.73 .net
>>104
エスパー募集ですか?
負の分散が生じるということはデータに問題があり、解決策はない気がしますが、
あなたが書いた式にケアレスミスがあることが原因である場合は、
エスパーでもない限り、読み手には分かりません。

再現できる最小のサンプルデータセットと、サンプルコー�


107:hを示せば、 誰かがあなたの間違いを指摘してくれるかも知れません。 まずは、データを半分、そのまた半分と削って、エラーの再現を確認してはどうですか。



108:132人目の素数さん
14/01/11 13:25:36.74 .net
すみません、Mac OS X Mavericksで、R3.0.2をつかっているのですが、起動すると下記のような警告メッセージが表示されるようになってしまいましたが、意味がよくわかりません・゜・(ノД`;)・゜・
何がおきているのでしょうか・・・

During startup - Warning messages:
1: Setting LC_CTYPE failed, using "C"
2: Setting LC_COLLATE failed, using "C"
3: Setting LC_TIME failed, using "C"
4: Setting LC_MESSAGES failed, using "C"
5: Setting LC_MONETARY failed, using "C"
[R.app GUI 1.62 (6558) x86_64-apple-darwin10.8.0]

WARNING: You're using a non-UTF8 locale, therefore only ASCII characters will work.
Please read R for Mac OS X FAQ (see Help) section 9 and adjust your system preferences accordingly.
[Workspace restored from /Users/ユーザ名/Documents/R/R_Working/.RData]
[History restored from /Users/ユーザ名/Documents/R/R_Working/.Rapp.history]

2014-01-11 13:20:07.129 R[1292:707] Can't open input server


109: /Users/ユーザ名/Library/InputManagers/SafariStand5.1.182



110:132人目の素数さん
14/01/11 13:39:16.70 .net
きもい

111:132人目の素数さん
14/01/11 13:55:39.23 .net
>>106
意味も何も、読んだそのままの意味だと思うけど。
ローケルがCなら、日本語を使っちゃダメだよ。
ターミナルでRと打ち込んでRを起動させたら何か変化がある?

112:106
14/01/11 14:30:33.12 .net
>>108
言語の問題だったですか・・・
最近、Macの言語環境を英語⇔日本語で何回か切り替えたのですがそれがいけなかったんでしょうか(ふだんは英語環境)

とりあえずあとでlocaleというのの設定をやってみます(localeという言葉をそもそも知らず、localかと思いました)

ターミナルから起動したら、とくに警告は表示されなかったです

113:132人目の素数さん
14/01/12 12:58:03.91 .net
[1]1 2 3 4 5 6 7
[2]8 9 10

1
2
3
4
5
6
7
8
9
10

と表示させるにはどうせたらよいでしょうか

114:110
14/01/12 13:58:14.10 .net
すんません、解決しました

115:132人目の素数さん
14/01/12 14:05:21.37 .net
おお、ちょうどレスしようと思ったのに
> a<-1:7
> b<-8:10
> c<-c(a,b)
> c.df<-as.data.frame(c)
> c.df

一応どうやって解決したかも書いてほしいな

116:132人目の素数さん
14/01/12 19:39:44.30 .net
ans<-lm(ch1~.,data)
ans2<-stepAIC(ans)
(略)
Step: AIC=6680.92
ans3<-lm(ch2~.,data)
ans4<-stepAIC(ans3)
   (略) 
Step: AIC=6260.8

(略)

ans47<-lm(ch24~.,data)
ans48<-stepAIC(47)
(略)
Step: AIC=8953.5

この出力されたAICの値(計24個)の値を比較して一番値が低いAICを表示したいです。
できる人いましたらやり方教えて下さい。

117:132人目の素数さん
14/01/12 21:27:42.56 .net
データフレームで、各行のすべての列の値を合計した列をつくることってできますか?
たとえば列が1月、2月、3月、、、ってなってて最後に年間計の列をつくりたいとか。
列を1個1個ベクトルで取り出して合計してからデータフレームに入れないとダメ?

118:132人目の素数さん
14/01/12 21:53:48.36 .net
data$total <- apply(data, 1, sum, na.rm=TRUE)

119:132人目の素数さん
14/01/12 22:09:11.87 .net
こうスレをみると、データフレームの勉強はした方が良さそうだな。
Rで統計計算ができるよお。だけじゃなくて、どうやってデータを揃えるかとかが大事になってくるなあ。

120:132人目の素数さん
14/01/13 00:19:12.09 .net
>>115
ありがとうございます。
そうでした、applyだった・・・
R-Tipsを読み直しました。

>>116
初心者なんですが、基本の操作を早く覚えたいです・・・

121:132人目の素数さん
14/01/13 11:04:58.62 .net
列名称やベクトルの名称などの、数字ではない情報を、for文などによって繰り返しで大量に生成することってできますでしょうか?
たとえば、"V1"という名称のベクトルから"V100"という名称のベクトルを、何らかの規則(たとえば1~99までの奇数の列を1倍したベクトル、2倍したベクトル、3倍したベクトル……など)

ようは、規則にしたがって名前をたくさんつけるという操作が可能なのかどうかを知りたいです

122:132人目の素数さん
14/01/13 11:05:58.75 .net
途中が消えてましたm(_ _)m

列名称やベクトルの名称などの、数字ではない情報を、for文などによって繰り返しで大量に生成することってできますでしょうか?
たとえば、"V1"という名称のベクトルから"V100"という名称のベクトルを、何らかの規則(たとえば1~99までの奇数の列を1倍したベクトル、2倍したベクトル、3倍したベクトル……など) に従って生成したい場合などです

ようは、規則にしたがって名前をたくさんつけるという操作が可能なのかどうかを知りたいです

123:132人目の素数さん
14/01/13 11:50:16.18 .net
as.character()

124:132人目の素数さん
14/01/13 16:12:10.53 .net
マニュアル読む気ゼロな奴が住み着いたな

125:132人目の素数さん
14/01/13 21:38:05.76 .net
>>120
ありがとうございます

126:132人目の素数さん
14/01/15 03:09:36.46 .net
&amp;&amp; || をにデータフレームの条件に使ってもエラー出ないのえ�


127:ョくない? ifの癖で間違っちゃうのだが。



128:132人目の素数さん
14/01/15 03:10:17.66 .net
あれっ?なんか文字化けみたいになったw

129:132人目の素数さん
14/01/15 13:59:16.86 .net
質問があります
A B
10 0.6
20 1.7
30 6.9
2.5 0.3
15 5.7
30 6.9
11 0.1
38 3.2
45 4.8
70 6.8
というようなデータフレームがあるのですが
Bは0<B<7の範囲をとる数字になっていていくつもの昇順データの連結物になっています
これをBの値が大きいものから小さいものに変わったときで切ってデータフレームを新しく切り出したいのですがどうしたらいいでしょうか

130:132人目の素数さん
14/01/15 20:22:02.46 .net
>>113
traceの最後に出てくるAICはextractAIC()で取出せるから、
ans2, ans4, ..., ans48をリストにして、
sapply(selectedModelList, extractAIC)して、sort()

>>125
グループ化すれば
grp <- 1
for(i in 2:nrow(data)-1){
if(data$B[i] < data$B[i+1]) grp <- c(grp, grp[i])
else grp <- c(grp, grp[i]+1)
}

131:132人目の素数さん
14/01/15 21:33:41.22 .net
psychというパッケージをつかってるんですが、たとえばfa()関数で因子分析をやったときに、その結果を全部まとめてcsvに出すことってできないんでしょうか?
因子パタンだけを
write.csv(分析結果$loadings, "分析結果.csv", quote=F)
とかやることはできるのですが、一式全部出力できないもんかと……

132:132人目の素数さん
14/01/17 01:55:48.44 .net
行列でできなくてデータフレームだとできることって何があるの?

133:132人目の素数さん
14/01/17 10:39:00.75 .net
>>127
>一式全部
多義的な表現なので、全部とは具体的にどのことかきちんと説明しないと、
期待する助言は得られないよ。Rオブジェクトとそのものなのか、
printメソッドなのか、summaryメソッドなのか、strか?

134:132人目の素数さん
14/01/17 10:45:33.92 .net
>>125
ずばっとやる方法は思いつかないなぁ。
B[i] > B[i+1]が成立したときのiを取り出して、
そこで切るとか。

135:130
14/01/17 10:48:05.50 .net
>>126 がすでに答えていたorz
なるほどね。グループ番号を付与するか、
思いつかなかった。

136:132人目の素数さん
14/01/17 18:02:57.01 .net
>>126
for文じゃなくてベクトルで一括処理するなら、
grp <- cumsum(c(F, diff(data$B)<0)) かな。

137:132人目の素数さん
14/01/17 20:05:05.18 .net
>>132
オォそれはスッキリ。皆よくヌルっとそういうのが出てくるね

138:132人目の素数さん
14/01/17 20:16:05.94 .net
>>132
すげー、天才だ!
こんなのが思いつくなって人間じゃない、イカれている

139:132人目の素数さん
14/01/18 17:02:01.35 .net
.Rprofileって、ワーキングディレクトリに置いておけばいいのでしょうか?
分析ごとにワーキングディレクトリをかえようと思っている場合、.Rprofileをコピーしてそれぞれのディレクトリにいれて、setwd()すればいいだけでしょうか?
Rを立ち上げているとき、どの.Rprofileが読み込まれて作動しているのか確認する方法が分からず・・・

どなたかアドバイスおねがいします

140:132人目の素数さん
14/01/18 17:45:25.40 .net
>>135
> どの.Rprofileが読み込まれて作動しているのか確認する方法

$ cat .Rprofile
Rprofile.version <- "1.0"

として、Rを起動してみると、
> ls()
[1] "Rprofile.version"
と.Rprofileが読み込まれている。
中身はもちろん
> Rprofile.version
[1] "1.0"
となる。つまり、識別のためのRオブジェクトを個別に.Rprofileに書いておけば、
区別はつく。

141:132人目の素数さん
14/01/18 17:57:56.34 .net
>>135
> .Rprofileって、ワーキングディレクトリに置いておけばいい
はい。ただし、起動時のカレントディレクトリとワーキングディレクトリが異なる場合は駄目。

?Rprofile
?Rprof
あたりは読もう。

142:132人目の素数さん
14/01/18 18:24:59.19 .net
>>136
なるほどたしかに!
ありがとうございます。

.Profileの置き場は、起動時の初期ワーキングディレクトリにおいてあるものが読み込まれるみたいなので、
preference > start upの画面で設定したディレクトリに置いとくしかないことも分かりました。

143:132人目の素数さん
14/01/18 18:26:04.88 .net
>>137
ありがとうございます
勉強します

144:132人目の素数さん
14/01/18 19:53:17.68 .net
>>138
Rを起動する流儀はひとそれぞれだけど、
csvファイルなどデータをおいたワーキングディレクトリに移動して、
csvファイルの中身や、その他のファイルの確認をしてから、
そこで(そのディレクトリで)Rを起動すると、
起動時のカレントディレクトリとワーキングディレクトリは同一になる。
つまり、ワーキングディレクトリに移動してからRを起動した方がいろいろと都合がよいし、
私はRを使い始めて10年来、このようにRを起動している。

どのディレクトリでRを起動しても、あなたの自由だよ。

145:132人目の素数さん
14/01/18 19:56:04.16 .net
>>140の追記。
ワーキングディレクトリに移動してからRを起動すると、
そのときにワーキングディレクトリに置かれた.Rprofileを読み込む。
だから、それぞれのワーキングディレクトリにそれぞれの.Rprofileを置くのは正解。

146:132人目の素数さん
14/01/18 23:17:37.61 .net
レベルの低いお話で恐縮です。
Rでは推測統計などで利用をしていましたが。プログラム的なものを作りたいと思うのですがちょっと歯が立たないです。
きっかかりを付けたいと思います。以下のような内容をスクリプトで書くと、どうなるかご提示いただけますでしょうか。

5*10の行列(一般的な意味)を用意して、これを"matA"とします。
//2行4列の場所をmatA[2][4]とします。

rowA = 3 colA = 5 coubA = 0.3 をmatAに入力します。
//上の式の意味はmatA[3][5]に0.3を配置します。という意味です。

以下同じように
rowA = 2 colA = 7 coubA = -0.3 をmatAに入力します。
rowA = 1 colA = 4 coubA = 0 をmatAに入力します。
rowA = 3 colA = 5 coubA = 0.4 をmatAに追加します。※
rowA = 1 colA = 4 coubA = 0.3 をmatAに追加します。※

//追加されたデータは元のデータ上に重ねていく3次元のイメージです。追加されるデータは、今後も増えていきます。
matA[2][7]を参照する。→ (-0.3) が返ってくる。(-0.3 0) が返ってくるのはNG
matA[3][5]を参照する。→ (0.3 0.4) が返ってくる。
matA[1][2]を参照する。→ 何も返さないか。(NA)が返ってくる。(0)や(0 0)が返ってくるのはNG

以上、お時間のある方、ぜひご教授くださいませ。

147:132人目の素数さん
14/01/19 01:07:18.05 .net
>>140
ありがとうございます
移動ってのは、ターミナルで操作されてるということでしょうか

148:132人目の素数さん
14/01/19 01:34:21.33 .net
>>142
arrayを使うのはどう?
簡単のために、重ねの最大が2つまでとして、
> matA <- array(NA, c(5, 10, 2))
> matA[3, 5, 1] <- 0.3; matA[2, 7, 1] <- -0.3; matA[1, 4, 1] <- 0;
> matA[3, 5, 2] <- 0.4; matA[1, 4, 2] <- 0.3
> matA[2, 7, ]
[1] -0.3 NA
> matA[3, 5, ]
[1] 0.3 0.4
> matA[1, 2, ]
[1] NA NA

NAがいやなら、na.exclude()でも使えばいい。
matA[3, 5, i]がNAでないなら、matA[3, 5, i + 1]に代入するような条件分岐で一般化すればいい。
別アプローチとしては、要素がlistの行列を作るという手もある。

149:132人目の素数さん
14/01/19 10:01:05.38 .net
>>142
matA<-matrix(NA,nrow=5,ncol=10)
じゃあダメなの?

150:132人目の素数さん
14/01/19 11:02:43.98 .net
>>144さん>>145さん ありがとうございました。スルーされるかと思ってた。

>>145さん。matrix 使うべきなのか array を使うべきなのか list なのか。
まだよく分かっていないのが正直なところです。

>>144さん スクリプト作成。ありがとうございます。
リストを使うのは難しくなりますでしょうか?
イメージとしては5*10の行列の碁盤の上に、個々のベクトルが上に育っていくような。
わかりずらいですね、、。
追加されていく要素は、今後も増えていく予定です。
重ねの数を初期値で


151:決めずに、追加される要素によって個々に増えていくという設定は難しい でしょうか。



152:132人目の素数さん
14/01/19 14:17:08.53 .net
>>146
リストがお好みなら
> dat <- data.frame(rowA=c(3, 2, 1, 3, 1), colA=c(5, 7, 4, 5, 4), coubA=c(0.3, -0.3, 0, 0.4, 0.3)) #1
> dat2 <- dat[dat$coubA!=0] #2
> matA <- lapply(1:5, function(i) lapply(1:10, function(j) NULL))
> for(i in 1:nrow(dat2)) {
+ v <- dat2[i,]
+ matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)
+ }
> matA[[2]][[7]]
[1] -0.3
> matA[[3]][[5]]
[1] 0.3 0.4
> matA[[1]][[2]]
NULL

#1 データはデータフレームが分かり易いかと思ってそうしたけど、ベクタでもマトリクスでも
#2 先にcoubA==0を除いたけど後から条件分岐でも良い。
#3 どうも俺が書くと美しくない...( ´・ω・`)

153:132人目の素数さん
14/01/19 16:01:58.81 .net
>>145
ダメに決まってるじゃん。
質問者の要件を良く読めよ。

146 > 重ねの数を初期値で決めずに、追加される要素によって個々に増えていくという設定
どうしても初期値があるとダメなら、
144 > 要素がlistの行列を作るという手
なんだけど(または >>147さんの方法)、
10000とか10000000000000000とか十分に大きな値を初期値に出来ないの?

>>143
はいそうです。実際には、Emacsの中でRを起動する訳だけど、
ターミナルというか、シェルから起動するのと概念的に同じです。
ソフトウェアの起動には2つに大別できて、
(1) ランチャーメニューから起動→ファイルを読み込む
(2) ファイルのあるディレクトリまで移動してファイルを開く=ソフトを起動する
あなたは(1)の方法でRを起動し、私は(2)の方法で起動するという違い。
(2)の場合は、シェルの中で移動するわけだけど、
OS XやLinuxのシェルはbashだったり、WindowsのシェルだとExplorerだったり。
bashを使うにはターミナルが必要。

154:132人目の素数さん
14/01/19 20:40:17.23 .net
>>147
ありがとうございます。いただいたスクリプトを吟味させていただきます。
これだけ作っていただけたら、リファレンス本を元に解読して理解できるようになると思います。

ついで、、読み飛ばしてかまいません。
自分の環境では以下の行で
dat2 <- dat[dat$coubA!=0]
次のエラーが発生してそれ以降の行で実行不可になってしまったのですが、
underfined colums selected
何かの理由があるか、自分の基本的なところの無知なんでしょうね。

>>148
フォローありがとうございます。
>10000とか10000000000000000とか十分に大きな値を初期値に出来ないの?
最終的には、10000件もの行列の要素の上にデータを重ねようと思っています。
Rがどのようにメモリを扱っているかわかりませんが、初期値によってメモリを確保する
のであれば避けておきたいと思っています。

155:132人目の素数さん
14/01/19 21:25:30.81 .net
>>149
すんません。コピペの後ごにょごにょしてたらカンマを落としたようです。
dat2 <- dat[dat$coubA!=0,]

156:132人目の素数さん
14/01/19 21:49:59.45 .net
すいません。ほんとうにありがとうございました。

157:132人目の素数さん
14/01/22 01:01:42.23 .net
>>147
ありがとうございます。
いろいろ検証させていただいています。
もう完璧ですね。Rに慣れていないから、と思っていたけど。
Rに慣れてもこのようなコード書けるかは自信がありません。

でもありがとうございました。

158:132人目の素数さん
14/01/22 23:50:01.23 .net
嵐山光三郎でR

159:132人目の素数さん
14/01/23 18:55:29.92 .net
The R Journal
URLリンク(journal.r-project.org)

こんなんあったんですね

160:132人目の素数さん
14/01/23 19:52:35.00 .net
>>154
以前に、R NewsからJournalに昇格した。

161:132人目の素数さん
14/01/23 21:36:08.80 .net
本買って読み始めたんだけど、

scores <- data.frame()
scores <- edit(scores)

で、いきなりR落ちた。

162:132人目の素数さん
14/01/23 23:55:51.45 .net
すいません先の>>147のスクリプトの下の文なのですが1行で表すことは可能でしょうか。
あるアプリから、この文をRに渡したいのですが。1構文1行じゃないといけないらしくて。
単純に改行を削るだけではRでエラーを返してしまいます。

> for(i in 1:nrow(dat2)) {
+ v <- dat2[i,]
+ matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)
+ }

163:132人目の素数さん
14/01/24 00:11:54.52 .net
>>157
よく分からないけど、1行なら
for(i in 1:nrow(dat2)){v <- dat2[i,]; matA[[v$rowA]][[v$colA]] <- c(matA[[v$rowA]][[v$colA]], v$coubA)}
だけど

164:132人目の素数さん
14/01/24 01:15:10.35 .net
>>158
セミコロンが構文の区切りなのですね。
うまく動きました。ありがとうございました。

165:132人目の素数さん
14/01/24 10:11:36.08 .net
>>159
まじで入門書を一度通読した方がよいと思う。

166:132人目の素数さん
14/01/25 00:04:22.24 .net
分割表からロジスチック回帰で使うようなデータフレームを作成する方法ってありますか?

167:132人目の素数さん
14/01/25 06:39:47.14 .net
>>161
そんなオナニー質問で、本気で助言をもらえると思ってるの?

168:132人目の素数さん
14/01/25 14:55:11.73 .net
うっせーハゲ

169:132人目の素数さん
14/01/25 15:34:42.28 .net
>>163
>>161本人か?
本人なら、分かるように質問し直せよ。
それとも、あんたは、
1. 先日拾った木材から寝室で使うような家具を作成する方法はありますか?
2. 朝摘みした野菜から夕食に出せるような食事を作成する方法はありますか?
3. 数字を使って数学のテストに出題するような問題を作成する方法ありますか?
という質問に対して、質問者が期待する回答を与えられるのか?

170:132人目の素数さん
14/01/25 16:42:32.84 .net
初心者には初心者に分かりやすく説明すればいいんだよ
お前は単に偉そうに説教したいだけだろ
2ちゃんでやっすい承認要求みたしておめでたい奴だなw

171:132人目の素数さん
14/01/25 17:11:47.96 .net
こういう毎日張りつくようなものでもないスレでカリカリしてるやつは見なきゃいいと思うんだけど
説明したいやつが説明するだろうし

172:132人目の素数さん
14/01/25 17:31:43.37 .net
>>165
はぁ?じゃあ、あなたは何故>>161 に答えてあげないのですか?
オナニー質問には答えようがないからでしょう?違いますか?
違うなら、あなたが助言してあげて下さい。
自分しか理解できないオナニー質問をするかしないかは、
質問者が初心者かどうかとは独立です。

173:161
14/01/25 22:30:46.52 .net
不完全な質問をして申し訳ありませんでした

その後Titanicのデータとepitoolsでなんとか理解することが出来ました.
カウントデータにNA が含まれていたため,分割表から個体ベースのデータフレームに出来ないことが判明しました..

お騒がせして申し訳ありませんでした

174:132人目の素数さん
14/01/25 23:26:11.74 .net
>>168
>>163>>161じゃなかったのなら非言申し訳ない。>>165が助言する様子はないので簡単に。
Rのglm()で指定するデータフレームは、必ずしも行が症例(個人)になっている必要はない。
条件ごとにカウントしたデータフレーム(たぶん、あなたが言う分割表)のデータフレームを用いる。
例えば、
> d <- data.frame(gender=rep(c("Male","Female"),c(6,6)),
+ dept=rep(LETTERS[1:6],2),
+ yes=c(512,353,120,138,53,22,89,17,202,131,94,24),
+ no=c(313,207,205,279,138,351,19,8,391,244,299,317))
> d
gender dept yes no
1 Male A 512 313
2 Male B 353 207
[snip]
11 Female E 94 299
12 Female F 24 317
という集計したデータフレームがあったとして、ロジスティックモデルを当てはめるには
下記のようにすればOK
> m <- glm(cbind(yes,no) ~ gender * dept, family = binomial(logit), data = d)
したがって、実験研究でよくあるカテゴリカルの場合は「個体ベースのデータフレーム」を用意する必要はない。

175:132人目の素数さん
14/01/26 00:26:27.29 .net
データが多くなると、DBの利用を考えたくなりますが、
お勧めありますか。SQLiteを使っている人が多い気がしますが。

176:132人目の素数さん
14/01/26 12:34:15.85 .net
これは良い正規分布
URLリンク(twicsy.com)

177:132人目の素数さん
14/01/26 21:49:02.61 .net
>>171
要するに、ほとんど運だということなのかね?

178:132人目の素数さん
14/01/27 22:44:56.77 .net
//質問させてください。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.3
matB[2,7,1]<--0.3
matB[1,4,1]<-0
matB[5,4,2]<-2.5

//という3次元の配列があるとします。
//数値要素以外はNAです。

//ここから3次元目の1つ目の表の最大値を取り出したいです。
//期待する値は0.3となります。
//apply(na.omit(matB),3,max)[1]など、いろいろ考えてみましたが
//違うようです。
//どのように表記すればよいか教えてください。

179:132人目の素数さん
14/01/28 00:39:30.32 .net
>>173
> max(matB[,,1], na.rm=TRUE)
[1] 0.3

180:132人目の素数さん
14/01/28 01:18:02.61 .net
>>174
ありがとうございました。

181:132人目の素数さん
14/01/28 10:13:11.86 .net
>>175
まぁ、これは初心者がはまりやすいポイントだからね。

> max(c(3, NA, 3, 3, 3))
[1] NA
> max(c(3, NA, 3, 3, 3), na.rm = TRUE)
[1] 3

182:132人目の素数さん
14/01/28 18:02:47.69 .net
>>176さん。ありがとうございます。
//>すいません、また質問させてください。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.1
matB[2,7,1]<-0.3
matB[1,4,1]<-0.3

//上のような3次元の配列があります。3次元目の一つ目の表には値が含まれていますが、
//二つ目の表は値が含まれておりません。

//3次元の各表に対して、値が入っているか値が入っていないかを知りたいと思います。
length(na.omit(matB[,,1]))
length(na.omit(matB[,,2]))
//では駄目でした。
//期待とする値は、入っているか入っていないかのブール値でも、
//入っている要素数の数(全部の要素がNAならば0)でも構いません。
//どうぞよろしくお願いします。

183:132人目の素数さん
14/01/28 18:30:56.14 .net
>>177
何か、このスレ、オレしか答えいない。

> for(i in seq_len(dim(matB)[3])){print(ifelse(sum(! is.na(matB[,,i])) == 0, "空でーす", "入っています"))}
[1] "入っています"
[1] "空でーす"

上記はmatB[,,1]は「入っています」、matB[,,2]は「空でーす」という意味。
forが嫌いなら、sapplyでも。

オナニー質問じゃない限りなるべく答えるけど、関数の意味は自分で調べてね。

184:132人目の素数さん
14/01/28 20:19:43.46 .net
>>178さん
同じ人でしたか。恐縮です。
もちろん関数の意味は、自分で調べます。
本当にありがとうございました。

185:132人目の素数さん
14/01/30 14:41:21.33 .net
//質問いたします。
matB <- array(dim=c(5,10,2))
matB[3,5,1]<-0.3
matB[2,7,1]<--0.3
matB[1,4,1]<-0
matB[5,4,2]<-2.5
maxvol<-max(matB[,,1], na.rm=TRUE)
maxvecB<-which(matB == maxvol)
lenrowB<-length(matB[,1,1])
if(maxvecB%%lenrowB==0){rowB <- lenrowB;colB <- maxvecB%/%lenrowB}else {rowB <- maxvecB%%lenrowB; colB <- maxvecB%/%lenrowB+1}

//上記は3次元の配列のうち3次元目の一枚目の表から、最大値を求め
//その要素の行値、列値を求めるスクリプトです。以下のように返ってきます。
> rowB
[1] 3
> colB
[1] 5

//わざわざ、maxvecBの要素番号を列の総数で割り、その剰余を利用して答えをだしています。
//たまたま、maxvecBの要素番号が列順に振られているのでうまくいきましたが、行順に振られていたら
//誤った値が返ってくるかと思います。
//もうすこし、シンプルな書き方があるような気がしてなりません。
//修正できるとこがありましたら教えていただきたいと思います。
//よろしくお願いします。

186:132人目の素数さん
14/01/30 15:30:36.11 .net
>>180
> シンプルな書き方
まぁ、そうだね。
> arrayInd(which.max(matB[,,1]


187:), dim(matB)) [,1] [,2] [,3] [1,] 3 5 1 とか。この位置の値を確認したければ、 > matB[arrayInd(which.max(matB[,,1]), dim(matB))] [1] 0.3 関数の意味は自分で調べてね。



188:132人目の素数さん
14/01/30 17:38:18.56 .net
ありがとうございます。いつもの同じ方でしょうか。
自分のが恥ずかしいぐらいシンプルです。
こうかけるようになれたらいいなあ。
ありがとうございました。

189:132人目の素数さん
14/01/30 17:47:03.20 .net
このスレ、かえって有害

190:132人目の素数さん
14/01/31 20:29:09.26 .net
rpubs.com って自分でホスティングするのは無理?

191:132人目の素数さん
14/02/02 21:38:49.85 .net
最近,emacsのorg-modeのorg-babelを使って,Rの解析結果をhtmlにexportした
レポートもどきを作成して,同僚に渡すようにしてる.やってることの解説と
code blockを交互に書くことで,同僚の理解も容易になって喜んでるんだけど,
問題は,code blockの数だけReturnを押さないといけないこと.5個や10個の
code blockなら良いけど,100個以上になると指がつりそうになる.全部を一気
に実行する方法を誰か知ってますか? スレ違いならゴメン.

192:sage
14/02/02 22:53:46.35 .net
>>185l
knitrはemacsもサポートしてるみたいだけど

193:132人目の素数さん
14/02/02 23:02:48.81 .net
グラフィックに続いておらいリーからまた本でたね。何でも載ってそうなんで、まよってるんだけど誰か買ったかな?

194:132人目の素数さん
14/02/03 00:02:22.42 .net
knitrは使ったことないんだけど,code blockを一気に処理できるの?

195:132人目の素数さん
14/02/03 18:19:44.13 .net
どなたか条件を指定して3次元プロットをする方法を教えていただきないでしょうか?
以下のデータを3Dプロットしようとする時、modernの値が3の場合赤、2の場合白、1の場合黄色とし、x軸はLの値、y軸はAの値、z軸はBの値としたいです。
L A B modern
1 48 54 32 3
2 21 32 15 2
3 87 2 78 2
4 45 102 12 3
5 54 91 31 2
6 7 21 81 3
7 87 64 12 1

196:132人目の素数さん
14/02/03 18:47:25.02 .net
>>189
3次元プロット自体はできるよね。
色分けは、例えばscatterplot3d()を使うなら、colorに色名のベクタを与えればよいだけ。
> modern <- c(3, 2, 2 ,3, 2, 3, 1)
なら、
> cols <- c("yellow", "white", "red")
> cols[modern]
[1] "red" "white" "white" "red" "white" "red" "yellow"
とすれば、色名のベクタが出来る

197:132人目の素数さん
14/02/03 19:08:02.33 .net
>>190
ありがとうございます。
3次元プロットは出来ます。
それぞれのデータ数が130ほどあるのですがこれも同じような形で解くのがよろしいのでしょうか?
質問ばかりしてしまい申し訳ないです。

198:132人目の素数さん
14/02/03 19:16:26.15 .net
できました!
本当に助かりました!

199:132人目の素数さん
14/02/03 22:32:09.24 .net
> knitrは使ったことないんだけど,code blockを一気に処理できるの?

自己レスです.ox-ravel.elというのを使えば,org-modeからknitrを使えるこ
とが分かった.URLリンク(github.com)
こいつでorg-modeからRhtmlを作って,それをRstudioにcompileさせるという流
れだな.複数のcode blockも一気に処理できるようだし,二度手間だけど100回
以上Return押すよりはマシなので,この方式に乗換を試してみる.初めて
knitr使ったけど,綺麗なhtmlできるのな.Rstudioちょっと見なおした.
> 186
ポイント,さんきゅ

200:132人目の素数さん
14/02/04 00:04:08.66 .net
真鍋●度は数学科だったんだな~

201:132人目の素数さん
14/02/05 16:42:31.84 .net
質問させてください
Basis splineで描画したグラフの任意の数値のy軸を求めることはできませんか?(下記


202:Basis splineのドキュメント) ttp://stat.ethz.ch/R-manual/R-patched/library/splines/html/bs.html 通常のspline補間では下記のサイトのようにやればpredictでx軸の数を指定すれば取得できたのですが ttp://d.hatena.ne.jp/hoxo_m/20110408/p1 Basis splineでの取得方法はないでしょうか 通常のspline補間のように指定したxの数を入力するとyを返してくれる方法が分かりません



203:132人目の素数さん
14/02/05 16:58:45.69 .net
すいません自己解決できました
お騒がせしました

204:132人目の素数さん
14/02/05 22:57:41.23 .net
質問があります。
環境はWindows7 32bitで、R3.0.1です。
RからC++のコードを呼びたいのですが、うまくいかないという話です。
C/C++コンパイラは、MinGW 4.8.1を入れて、RもMinGWも単体では問題無く動いています。

とりあえず、
--------------------
#include <vector>

extern "C" void test(double* a) {
std::vector<std::vector<double> > x(5);
}
--------------------
という何もしないファイルを、test.cppとして作って、Rcmd.exe SHLIB test.cppでコンパイルして、
さらに、Rから、
dyn.load("test.dll")
.C("test", arg1=as.double(c(1,2,3)))
dyn.unload("test.dll")
とかすると、問題無く実行できます。
(まあ何もしないですが。)

続きます。

205:197
14/02/05 22:58:34.64 .net
続きです。

でも、上のtest.cppを
--------------------
#include <vector>

extern "C" void test(double* a) {
std::vector<std::vector<double> > x(5);
std::vector<double> y(5);
}
--------------------
と変えてコンパイルして、Rから
dyn.load("test.dll")
dyn.unload("test.dll")
と実行すると、dyn.unloadのところでR毎エラーで止まってしまいます。
エラーメッセージは
Microsoft Visual C++ Runtime Library
This application has requested the Runtime to terminate it in an
unusual way.
Please contact the application's support tem for more information.
となぜか英語で出てきます。
メモリ管理周りが怪しい気がしますが、そもそも.Cでコードを実行していなくて、dllを
ロードしてアンロードしただけでエラーが出るのもわかりません。
だれが原因がわかるかたいませんか?

206:132人目の素数さん
14/02/06 09:50:21.68 .net
>>197
C++を使ったことがないので、
あまり価値のない情報だと思うが、
R 3.0.2 on Ubuntu 13.10で追試したところ、
x(5)のみのソースも、y(5)の行を足したソースも、
どちらも、エラーなし。
> dyn.load("test.so")
> .C("test", arg1=as.double(c(1,2,3)))
$arg1
[1] 1 2 3

> dyn.unload("test.so")
>

207:132人目の素数さん
14/02/06 22:02:51.67 .net
質問させてください
「data」+通し番号で150個存在するデータフレームがあるのですが
データを整形加工していくうちにデータ長が0になってしまったデータフレームをデータ長が1以上残っているものでリネームして通し番号を詰めていきたいのですが
地道に調べてやっていくしかないでしょうか
具体的には
data002がnrow(data002)=0の時、次にnrowでデータ長を調べて0じゃないものがdata003の時
nrow(data003)>0の時data002<-data003
data004とdata005のデータ長が0でdata006が0じゃないときはdata004<-data006といった具合に
のように代入して詰めたいです

208:132人目の素数さん
14/02/07 10:25:41.62 .net
>>200
自分なら次のようにします。
操作が面倒なので、150個のデータフレームを1つのリストオブジェクトにぶち込んで、
nrow()で判定して、削除。次に、連番を振りながら、個々のデータフレームを出力。
これで少なくとも見かけ上は「番号を詰めた」状態になります。

> a <- list(data002 = data.frame(x=1:10), data003 = data.frame(), data004 = data.frame(x=1:10))
簡単のために3つのデータフレームからなるリストで説明すると、
リストaの2番目の要素であるデータフレームの行が空になった状態。

> i <- sapply(a, function(x){nrow(x) != 0})
> a.truncated <- a[i]

これで、nrow()が0のデータフレームが削除されたリストができる。
Rでは、"["関数を積極的に利用した方が効率がよいと思う。
分かりやすいように2行に分けてたけど、
> a.truncated <- a[sapply(a, function(x){nrow(x) != 0})]
1行で十分。

リストから、個々のデータフレームに出力するにはassign()を使えばいい。
> for(i in seq_along(a.truncated)){assign(paste0("data", sprintf("%03d", i)), a.truncated[[i]])}
とすれば、data001, data002が出力される。

209:132人目の素数さん
14/02/07 11:52:16.93 .net
できました!
ありがとうございました!

210:132人目の素数さん
14/02/09 14:53:49.19 .net
Rをq()という関数で閉じようとするとき、
「workspaceを保存しますか。」というウィンドウが表示されます。
「いいえ」と答えて、そのまま閉じる過程まで、
スクリプトで指示することができますか?

211:132人目の素数さん
14/02/09 15:54:09.96 .net
>>203
さすがにこれはヘルプ見ろと叱られても仕方がないレベルでは?
?q

212:132人目の素数さん
14/02/09 16:31:07.01 .net
10日前にMacBook Pro 買って断然プログラム
モチ(マスター)ベーション
があがったよ

213:132人目の素数さん
14/02/09 18:02:24.94 .net
>>205
おめでとう*\(^o^)/*
Macは本物のUNIXマシンだから
数学やるには最適
頑張ってね

214:132人目の素数さん
14/02/09 18:04:33.54 .net
UNIXマシン?

215:132人目の素数さん
14/02/09 21:21:46.25 .net
UNIXを個人で使ってもあんまり意味ねえだろw
UNIXの発展系Cが本物のプログラム言語だから
いろいろな意味で最適
ならわかるがw

216:132人目の素数さん
14/02/10 03:32:55.67 .net
Macは邪悪なBSDと言われていて本物のUNIXじゃないよ。

パクリもののなんちゃってUNIX。

217:132人目の素数さん
14/02/10 04:10:41.30 .net
素人解説ww
OSXは正式にUNIX 03の商標を取得しているホンモノだよ。
UnixライクなOSとは別次元。

UNIX 03で個人が気軽に使えノートも有るのはMacだけ

218:132人目の素数さん
14/02/10 04:51:59.73 .net
OSの開発に失敗して、ソースパクっておいて自分だけ申請して自分こそが本物だと名乗る。

まさに詐欺師。

219:132人目の素数さん
14/02/10 17:06:47.17 .net
マカーは捏造ばっかりするから嫌われる。

220:132人目の素数さん
14/02/10 18:03:51.66 .net
繰り返し文わかる人いますか?
a1_1<-lm(x1_1~.,data_1)
a1_3<-lm(x1_2~.,data_1)
a1_5<-lm(x1_3~.,data_1)
  :
a1_43<-lm(x1_22~.,data_1)
a1_45<-lm(x1_23~.,data_1)
a1_47<-lm(x1_24~.,data_1)
a2_1<-lm(x2-1~.,data_2)
a2_3<-lm(x2-2~.,data_2)
a2_5<-lm(x2-3~.,data_2)
  :
a2_43<-lm(x2-22~.,data_2)
a2_45<-lm(x2-23~.,data_2)
a2_47<-lm(x2-24~.,data_2)
:
a12_1<-lm(x12_1~.,data_12)
a12_3<-lm(x12_2~.,data_12)
a12_5<-lm(x12_3~.,data_12)
  :
a12_43<-lm(x12_22~.,data_12)
a12_45<-lm(x12_23~.,data_12)
a12_47<-lm(x12_24~.,data_12)
このようにa12までを、くり返し文を使って短く表すことは出来ますか?
参考書を見てもわからなかったので、質問しました。

221:132人目の素数さん
14/02/10 18:57:31.58 .net
>>213
> くり返し文を使って短く表す
念のために確認しますが、「繰り返し文」は必須ですか?
繰り返し文を使わずに短くするのがルール違反なら、面倒くさいんだけど。。。

222:214
14/02/10 20:06:33.32 .net
反応ないけど、繰り返し文なしの一括化+マルチコア化を書いておこう。

説明を簡単にするために、デモデータをdata_1の分だけ作成。
data_2...data_12は今から説明するlapply()を入れ子にすればよい。

> data_1 <- data.frame(matrix(runif(100 * 47), 100))
> names(data_1) <- paste("x1", 1:47, sep = "_")

さて、先に式のリストを作成する。

> a <- sapply(paste0("x1_", 1:47, "~."), as.formula)

このaに対して、lmを実行すればよい。

> lapply(a, function(x){lm(x, data_1)})

ちなみに、multicoreパッケージを入れると、
> library(multicore)
> system.i lapply(a, function(x){lm(x, data_1)})
system.file system.time
> system.time(lapply(a, function(x){lm(x, data_1)}))
ユーザ システム 経過
0.398 0.001 0.399
> system.time(mclapply(a, function(x){lm(x, data_1)}))
ユーザ システム 経過
0.347 0.083 0.183
こんなに早くなる。

223:132人目の素数さん
14/02/10 20:09:54.63 .net
「> system.i lapply(a, function(x){lm(x, data_1)})
system.file system.time 」
↑ゴミが入ったorz

224:132人目の素数さん
14/02/11 00:00:16.50 .net
繰り返し分は使わなくて大丈夫です。
できました。ありがとうございました。
一括化とマルチコア化は勉強になりました。

225:132人目の素数さん
14/02/11 14:52:18.34 .net
商標とかそういうのじゃなくて、UNIXの精神を受け継いでいないよなMacは

226:132人目の素数さん
14/02/11 22:58:26.31 .net
Mac retina Pro 良いよ

227:132人目の素数さん
14/02/11 23:18:33.31 .net
>>218
じゃあ誰がUNIXの精神を引き継いでいるんだ?

アホはMacを使いこなせないだけ
ノータリンのミュージシャンでも
Macは使えるが、ちゃんとUNIXとして
使えば偽UNIX類とは別次元の完成度だな

228:132人目の素数さん
14/02/12 21:50:50.47 .net
Unixがアレだからなぁ。
マカーもずっとUnixの悪口言ってたのに
どの口でMacこそ本物のUNIXとか言ってるんだろう?

ほんとマカーは馬鹿だと思う。

229:132人目の素数さん
14/02/13 19:00:41.28 .net
windows Let's note
thinkpad
apple Mac ritena Pro

いろいろ便利だな~

230:132人目の素数さん
14/02/14 22:03:16.24 .net
【経営戦略】ビッグデータに死ねと言われた東急 山田祥平のRe:config.sys[14/02/14]
スレリンク(bizplus板)

Microsoftがとうとうきたかw
Power BI for Office 365でビッグデータ解析の民主化とはな

231:132人目の素数さん
14/02/14 23:39:53.27 .net
アホですな。そんな意見聞いてたら捏造コピペしまくるネトウヨの思うツボです。

232:132人目の素数さん
14/02/16 15:52:28.14 .net
plot3dで濃淡を指定ってできますかね?
scatterplot3dで図を作ったのですが動かせるようにしてくれと言われたので…

233:132人目の素数さん
14/02/16 16:55:53.07 .net
すいません。>>189をplot3dで濃淡表示したいのです。
ホームページを参考にして
color = rep( grey( c( length(Modern ):1 ) / length( Modern ) ) )
として
plot3d(x=l,y=a,z=b,col=color,size=8)としたら濃淡表示にはできるのですがmodernの数字と濃淡が一致しないのです…。
番号が小さいほど黒くしたいです。

234:132人目の素数さん
14/02/16 18:34:48.02 .net
>>226
濃淡(明度)と彩度と色相は独立なので、いまいち意味が分からないが、
君の言う「濃淡」とは、グレー階調のこと?
それなら、
grey(Modern / max(Modern))
とか、
grey(1 - Modern / max(Modern))
じゃないの?番号が小さい方を濃くしたいなら、前者か。

> color = rep( grey( c( length(Modern ):1 ) / length( Modern ) ) )
意味不明。特にrep()。
c( length(Modern ):1 )はc()を使う必要なし、( length(Modern ):1 ) でOK
> Modern <- sample(3, 10000000, TRUE)
> system.time(c( length(Modern ):1 ))
ユーザ システム 経過
0.154 0.052 0.359
> system.time(( length(Modern ):1 ))
ユーザ システム 経過
0.020 0.001 0.022
c()で激遅になる。

235:132人目の素数さん
14/02/16 18:50:03.22 .net
ありがとうございます。
R初心者で分厚い本とHPを参考にしながら只今奮闘中です^^;
右も左もわからない自分にとってここのサイトはとても助かります!!

236:132人目の素数さん
14/02/16 19:06:06.58 .net
連投すいません
グレー階調を行った場合一番高い数字は白になりますか?

237:132人目の素数さん
14/02/16 19:18:51.27 .net
>>229
> grey(1)
[1] "#FFFFFF"
> grey(0)
[1] "#000000"

1を代入したら白ですね

238:132人目の素数さん
14/02/16 19:25:01.37 .net
ありがとうございます。
なんとか白が見えるようにならないでしょうか?
背景色をかえれるかなと思ってコマンドを打ってみたのですが変わらなくて…
Modernの数値を変えたらいいのでしょうか?

239:132人目の素数さん
14/02/16 19:32:11.72 .net
背景色変えられました!
bg3dではなくbgと打ってました…

240:132人目の素数さん
14/02/21 17:50:49.16 .net
>>185
Emacs に不可能はない
C-c C-v b or C-c C-v C-b org-babel-execute-buffer

241:132人目の素数さん
14/02/22 14:58:46.83 .net
質問です。optimizeでパラメーターを求めたいのですがエラーが出てしまい、出来ません。

X<-c(1,2,3,4,5,6,7,8,9,12,13,24)

T<-length(X) #データ数
q<-3 #次数
eps<-X #diff(log(X))#収益率

ty<-function(alpha,omega){
for( t in 1:T){

alpha[1]
alpha[2]
alpha[3]
omega

for( j in 1:q ){
AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
A<-(log(omega+AA)^2)*(-1/2)
print(eps[abs(t+3-j)])
}
}
}

optimize(c(2,1,2,3),ty, maximum=TRUE)

242:132人目の素数さん
14/02/22 15:50:55.18 .net
目的関数がよくわからん
何を最適化したいのかな
あとoptimizeは1変数じゃなかったっけ、optimのほうがいいかも
あとAAの初期値がいるかな

243:132人目の素数さん
14/02/22 16:03:21.43 .net
Aを目的関数にしてみた

X<-c(1,2,3,4,5,6,7,8,9,12,13,24)

T<-length(X) #データ数
q<-3 #次数
eps<-X #diff(log(X))#収益率
AA<-0 #initial

ty<-function(par){
for( t in 1:T){

alpha<-c(par[1],par[2],par[3])
omega<-par[4]

for( j in 1:q ){
AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
A<-(log(omega+AA)^2)*(-1/2)
#print(eps[abs(t+3-j)])
return(A)
}
}
}
opt.Nelder<-optim(c(2,1,2,3),ty,control=list(fnscale=-1,maxit=200000,
trace=TRUE),method="Nelder-Mead")

opt.BFGS<-optim(c(2,1,2,3),ty,control=list(fnscale=-1,maxit=200000,
trace=TRUE),method="BFGS")

244:132人目の素数さん
14/02/22 16:06:35.40 .net
なんか変だな、ナシで

245:132人目の素数さん
14/02/22 16:11:09.60 .net
>>234
>AA <- alpha[j]*eps[t+3-j]*eps[t+3-j] + AA
これはepsの長さ超えるぞ

246:132人目の素数さん
14/02/23 02:23:09.17 .net
234です。皆様ご教授ありがとうございます。

>>235
目的関数はAAです。オメガ、アルファを求めたいです。
optimで実行した際にエラーが出てしまい、optimizeで実行しろと表示されてしまったため、optimizeを使っています。

やりたい事は、ARCHモデルの対数尤度関数を表示したく、練習として3次のARCHモデルの対数尤度関数に近いものを作りました。
>>234
確かにepsの長さが超えてますね。ご指摘ありがとうございます。
自己回帰なので過去の値に戻りたいのですが...勉強します。

247:132人目の素数さん
14/02/23 02:25:18.09 .net
>>234ではなく
>>238

248:132人目の素数さん
14/02/23 08:31:12.95 .net
受験勉強の合間に
息抜きで作業してるとMacBook Pro13インチが小さく感じるな・・・
15インチかiMac 2□インチが必要な気が・・・

249:132人目の素数さん
14/02/23 08:38:03.42 .net
老眼か?
いったい何浪してるんだよ

250:132人目の素数さん
14/02/24 06:16:12.29 .net
>>242 勘弁してよ~

251:132人目の素数さん
14/02/25 17:06:50.33 .net
質問です。
optim関数を実行した際に、「


252:初期パラメータで関数を表示出来ません」とエラーが出てしまいます。 関数の式は間違ってないと思うのですが、原因がわからないため、ご教授お願いいたします。 コードはこちらです。 sai <- function(x) { T<-length(x); q<-3; eps<-diff(log(x)) ts.plot(eps) Mean <- mean(x); Var <- var(x); S = 1e-6 parm <- c(0.1,0.1*Var ) archsai<-function(par){ for( t in 2:T){ alpha<-c(par[1]) omega<-par[2]  if(t<=1){ htt<-omega }else { htt <- (omega+alpha[1]*eps[t-1]^2) ht <- sqrt(htt) A <- -(log(htt))^2*(1/2) B <- -(((eps[t])^2)/htt)*(1/2) ln <- A+B   } } return(ln) } optim(parm,archsai,control = list(fnscale=-1) ) }



253:132人目の素数さん
14/02/25 21:18:55.66 .net
>>244
この前の人かな?xは前のXでいいのかな?

>B <- -(((eps[t])^2)/htt)*(1/2)
ここt-1じゃないのか

254:132人目の素数さん
14/02/25 21:32:07.00 .net
>>245
そうです。236の際はお世話になりました。
xは前のXで大丈夫です。

ありがとうございます。無事に出来ました。

255:132人目の素数さん
14/02/25 21:34:35.44 .net
236ではなく、234ですね。

256:132人目の素数さん
14/02/25 21:36:48.35 .net
>>246
そうかそうか。一応言っておくけどhttが負になってsqrt()でwarnings()出てるよ
何か制約条件があれば追加したほうがいいかな

257:132人目の素数さん
14/02/25 22:29:08.17 .net
>>248

ご丁寧にありがとうございます。
条件つける事で無事解決しました。

258:132人目の素数さん
14/02/25 22:57:04.23 .net
明日の16時39分頃に気をつけて下さい。
日本にも世界にも巨大地震が起きませんように。
皆さんも一緒に祈って下さい。

太陽フレアのXが発生しました。
太陽黒点数の100越えが24日間継続しているようです。

259:132人目の素数さん
14/03/12 20:18:06.86 .net
library(foreign)
yield <- read.dta("URLリンク(www.stata-press.com))
tx <- with(yield, interaction(fertilizer, irrigation))
amod <- aov(yield ~ tx, data=yield)
library(agricolae)
HSD.test(amod, "tx", group=TRUE)

これをちゃんと動作させることって出来ますか?結果が出てきません。どこかミスしているんでしょうか?
ちなみにyield.dtaは表です。

260:132人目の素数さん
14/03/13 09:31:48.35 .net
>>251
動作しないとは具体的にどういうこと?
> HSD.test(amod, "tx", group=TRUE, console = TRUE)

Study: amod ~ "tx"

HSD Test for yield

Mean Square Error: 24.93463

tx, means

yield std r Min Max
1.0 36.91257 5.335857 20 25.54710 46.60105
[snip]
5.1 44.55313 4.663802 20 31.20605 51.55704

alpha: 0.05 ; Df Error: 190
Critical Value of Studentized Range: 4.527912

Honestly Significant Difference: 5.055736

Means with the same letter are not significantly different.

Groups, Treatments and means
a 2.1 51.18
ab 4.1 50.75
[snip]

261:132人目の素数さん
14/03/13 18:35:25.07 .net
pre_vecB<- c(1,2,3,4,0)
#pre_vecB<- c(0,0)
out_vecB<-mean(pre_vecB[pre_vecB!=0])

0があれば、0を除いて平均を求める。
0しかなければ、NAを返す。(NAN)でない。
というスクリプトを書きたいのですが、スマートな書き方ありますでしょうか?

262:132人目の素数さん
14/03/13 19:36:48.92 .net
>>253
スマートかどうか分からんが、自分ならこうする。
ifelse(is.nan(a <- mean(pre_vecB[pre_vecB != 0])), NA, a)

263:132人目の素数さん
14/03/13 19:42:46.86 .net
>>252
ありがとうございます。結果が表示されるようになりました。ってconsole=TRUEが抜けてただけでした。
申し訳ありませんでした。R初心者にも門戸を開いて頂きありがとうございました。
私は分散分析、回帰分析がRで出来るようになれればなーと思っているところです。
SPSSからの移行です。頑張って精進します。

264:132人目の素数さん
14/03/14 22:43:43.25 .net
>>254
ありがとうございました。参考にさせてください。

265:132人目の素数さん
14/03/15 17:52:29.30 .net
均一分散の仮定をせずにWhiteの推定量で回帰するにはどうしたらいいの?
普通にlmじゃ無理?

266:132人目の素数さん
14/03/15 18:09:43.39 .net
>>257
> RSiteSearch("heteroscedasticity white")
これでcarパッケージのhccm関数やrmsパッケージのrobcov関数にたどり着くよ

267:132人目の素数さん
14/03/20 19:50:08.95 .net
> x<- seq(1,20,2)
> x
[1] 1 3 5 7 9 11 13 15 17 19

こういったベクトルがあって、このベクトルの後ろからN個の要素
を抜き出したいです。

Nが4なら
13 15 17 19
と返したいです。どのように書けばよろしいでしょうか?

268:132人目の素数さん
14/03/20 21:15:45.46 .net
tail(x,4)

269:132人目の素数さん
14/03/21 22:49:16.51 .net
>>260
ありがとうございます。そのまんまの関数ですね。
知らなかった。

270:132人目の素数さん
14/03/22 15:00:41.16 .net
0が含まれれば0を除外して平均を求める。0しかなければNAを返す。
というサンプルです。
これを実際に運用してみると、単に平均を求めるスクリプトに比べ大変時間が
掛かることに気づきました。
webで調べてみると、ifelse文を使うと遅くなるという記事をみかけます。
同じ意味で、早く稼働するスクリプトがありましたら教えてください。


#vecA<- c(0,0,0)
vecA<- c(1,3,0)
ifelse(is.nan(a<- mean(vecA[vecA!=0])),NA,a)

ifelse(is.na(b1<-median(pre_listB[pre_listB!=0])),0,b1)

271:132人目の素数さん
14/03/24 13:51:22.64 .net
あぁ、本当だねぇ。ifelseにするとifよりも遅くなるねぇ。
ifelseを提示したのは、そちらの方が分かりやすいと思ったから。
すまなかったねぇ。
> system.time(sapply(1:1000, function(x){vecA = c(1, 3, 0); ifelse(is.nan(a <- mean(vecA[vecA != 0])), NA, a)}))
ユーザ システム 経過
0.042 0.000 0.059
> system.time(sapply(1:1000, function(x){vecA = c(1, 3, 0); if(is.nan(a <- mean(vecA[vecA != 0]))){mean(a)}else{NA}}))
ユーザ システム 経過
0.023 0.000 0.029

272:132人目の素数さん
14/03/25 15:18:11.06 .net
>>263
ありがとうございます。ifelse文がわかりやすかったから大変勉強に
なりました。
実装データの量が多くてどうしたもんだかと悩んでたもので、
新たなスクリプト助かります。
自分は基本Cを書いてますが、Rの文が摩訶不思議に思えてしまいます。
system.time()の使い方も初めて知りました。ありがとうございました。

273:132人目の素数さん
14/03/25 17:43:35.11 .net
>>264
Cの人から見たらRは摩訶不思議かも知れないけど、
変態言語のPerlよりもずっとまし。

274:132人目の素数さん
14/03/26 23:24:54.38 .net
id <-c(1,2,3,4,5)
sex <-c("F","F","M","M","M")
height<- c(180,192,170,175,180)
weight<- c(50,65,60,55,70)
(MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height))

上のようなデータフレームがあるとします。

ここでid=3の行データを以下のように変更(差し替え)したいとするとき、
ID = 3;
SEX = "F"
HEIGHT =150
WEIGHT =55

どう書けばいいでしょうか?

275:132人目の素数さん
14/03/27 09:58:04.57 .net
>>266
>(MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height))
じゃなくて、
> (MYDATA<- data.frame(ID= id, SEX= sex, HEIGHT= height, WEIGHT = weight))
だよね。で、date.frameのrow向きの差し替えは、べたな方法しかないと思うよ。
どこかのパッケージに当該機能を有する便利な関数があるのかもしれないが。
> MYDATA[3, ] <- list(ID = 3, SEX = "F", HEIGHT = 150, WEIGHT = 55)
> MYDATA
ID SEX HEIGHT WEIGHT
1 1 F 180 50
2 2 F 192 65
3 3 F 150 55
4 4 M 175 55
5 5 M 180 70

276:267
14/03/27 10:10:01.03 .net
気になって試行錯誤をしたら、順番が正しければ変数名は省略できるようだ。
> MYDATA[3, ] <- list(3, "F", 150, 55)
ただし、変数名があってもなくても、順番を間違えると、期待通りの結果を得られないから要注意。
また、変更箇所が多ければ、edit()を使うことを勧める。
うちは、
> Sys.getenv("EDITOR")
[1] "vi"
だけど、使い慣れたテキストエディタを設定しておいた方がよいだろう。
viのキーバインドを知らなかったら、混乱すると思う。

277:132人目の素数さん
14/03/27 15:38:26.02 .net
>>267
ありがとうございます。WEIGHT忘れてました。
list()と、MYDATA[,]でデータフレームのリスト要素を変更できるの
ですね。
これを使えば、変更(差し替え)だけでなく、列を追加するのにも
同じやり方なので便利ですね。

edit()の使い方もありがとうございました。

278:132人目の素数さん
14/03/27 16:23:23.60 .net
>>269
お役に立ったようで、どうも。
行(row)や列(col)の追加は、もっと簡単でrbind()やcbind()を使います。

列の場合は
MYDATA$新変数 <- runif(5)
とかでも、MYDATAデータフレームの中に新しく「新変数」が作成されます。

# RjpwikiのQ&Aで質問が放置されていたので回答したけど、
# 河童さんはやっぱりggplotが嫌いなんだな。

279:132人目の素数さん
14/03/28 15:07:08.25 .net
普通のプログラムでは、0割するとクラッシュしてしまうから、
事前に0割を避ける条件文を作らなくてはいけないんだけど。
Rでは、Infが返ってくるだけなのだから、(クラッシュしない)
答を求めて、Infが出たときに対応の処理をさせてもいいですよね。

プログラムとして0割に対して特に対応しなくてもいいですかね。

280:132人目の素数さん
14/03/28 15:32:41.65 .net
>>271
そんなのプログラムによる話で、一般化できない。

281:132人目の素数さん
14/03/29 10:39:15.46 .net
>>271
まともな統計ソフトならみな対応してるよ

282:132人目の素数さん
14/03/29 11:28:09.36 .net
>>273
エ、エクセルとか(震え声)

283:132人目の素数さん
14/03/29 11:53:57.77 .net
Excelは表計算ソフトでしょ。
アドインは発注品だし、マイクロソフトは統計ソフト作っているわけじゃないし。
アドインの酷さは検索すれば出てくるよ。

284:132人目の素数さん
14/03/30 18:10:19.21 .net
Perlの小飼弾は天才
UCB

285:132人目の素数さん
14/03/31 13:39:43.19 .net
河童さんは関西人だったのか。
東京の人はチャーリー浜なんて知らないよね。

286:132人目の素数さん
14/04/02 07:56:27.99 .net
Mac版だと--interactiveという起動オプションがありますが、
Windows版だとこれではなく、変わりに--essという起動オプションがあります
この2つのオプションの挙動に何か違いはありますか?
VimShellの:VemShellInteractiveで呼んでいるのですが、現状違いはないように
思えて、オプション名が違う理由がよくわかりません

287:132人目の素数さん
14/04/02 08:50:54.70 .net
オプションが名が違うのは別のオプションだからです。以上。

288:132人目の素数さん
14/04/02 17:15:20.26 .net
>>278
>VimShell
初めて聞いた。便利そうだけど、所詮、ESSには勝てないと思う

289:132人目の素数さん
14/05/13 09:43:49.49 .net
>>281
スルー検定�


290:ヘ全員合格か。素晴らしい。 ExtraTrees法なら、extraTreesパッケージかな。



291:132人目の素数さん
14/05/15 01:39:45.15 .net
writewebGLで保存した図をパワーポイントに図として乗せたいのですが動かせる形でパワーポイント上に図として乗せるにはどうすればいいでしょうか?

292:132人目の素数さん
14/05/15 04:49:00.39 .net
Livewebってやつのpptアドインがあるみたいだけど上手く行かんな

293:132人目の素数さん
14/05/18 12:35:30.99 .net
グラフをアスキーアートで書くとか
フレームバッファに書くとか
できますか?

294:132人目の素数さん
14/07/07 23:56:58.21 +w/piBrtZ
初心者です。
例えば、次のような構文をRで繰り返し文などを使って
短くするやり方が知りたいです。

x1<-test[c(1:100),c(2),]
x2<-test[c(1:100),c(3),]
x3<-test[c(1:100),c(4),]
     :
     :
x100<-test[c(1:100),c(101),]
わかる人いたら教えてもらえればありがたいです。

295:132人目の素数さん
14/07/10 01:22:22.72 .net
ThreeWayパッケージのT3って三相因子分析のことなのでしょうか?

296:132人目の素数さん
14/07/10 11:45:59.03 .net
>>286
何でマニュアルを読まないの?
T3: Interactive Tucker3 analysis
Description: Detects the underlying structure of a three-way array according to the Tucker3 (T3) model.

とりあえず、下記を読んだら?
P. Giordani, H.A.L. Kiers, M.A. Del Ferraro (2014). Three-way component analysis using the R
package ThreeWay. Journal of Statistical Software 57(7):1–23.

L.R Tucker (1966). Some mathematical notes on three-mode factor analysis.
Psychometrika 31:279–311

297:132人目の素数さん
14/07/10 12:37:38.03 .net
ありがとうございます。
PCAUSP(超行列の主成分分析?)でcomponentの数の決定を行うと思うのですがここでのcomponentはそれぞれのモード?の因子数を選択しているのでしょうか?
よろしくお願いします。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch