ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

Rをまじめに勉強する-その4:基本的な記述統計を一通り

2013-06-21 17:25:45 | AI・BigData
前回の続き

統計解析フリーソフト R の備忘録頁 ver.3.1
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html



Rで統計 - R入門
http://home.hiroshima-u.ac.jp/chubo/index.cgi?R%a4%c7%c5%fd%b7%d7

をもとに、Rを勉強してみる

まずは、基本的な操作ということで、記述統計の世界をやってみる。
・データの確認
・1変数の基本的な統計量
・2変数の基本的な統計量(数値)
・2変数の基本的な統計量(選択肢)
についてみてみる



■データの確認
 データの読み込みに関しては、別の機会にやることにして・・・
 とにかく、データを読み込んだ、あるいは、Rに備え付けられているデータを利用するとする。

 今回は、CO2というRに備え付けられているデータを利用する。

 そのデータを確認したい場合は、

<<項目名を表示する>>
names(CO2)

<<先頭数行を表示>>
head(CO2)

<<終わり数行を表示>>
tail(CO2)

<<全体表示>>
CO2

こんなかんじ





■1変数の基本的な統計量

 CO2$項目名 で、その項目のカラムすべてが取り出せる。
 このカラムが、数値データの場合、以下のような平均、不偏分散、不偏分散の標準偏差、メジアンなどは、いかのように求められる。

<<平均>>
mean(CO2$conc)

<<不偏分散>>
var(CO2$conc)

<<不偏分散の標準偏差>>
sd(CO2$conc)

<<メジアン>>
median(CO2$conc)

 不偏分散ではなく、分散と標準偏差を求めたい場合、不偏分散を(n-1)/n倍すれば求まる。
 ここで、nは標本数なのだが、その標本数を求めるには

<<標本数>>
length(CO2$conc)

 なお、summaryを使うと、
  数値データに関しては、四分位点や、平均を求め、
  選択肢を選ぶようなものに関しては、各選択肢の件数
 が表示される

summary(CO2)

 なお、数値しか表示できないmeanに、CO2と指定して、選択肢のデータも表示させようとすると

 のように、警告が出る。

 また、図で表示させたい場合は、
<<ヒストグラムを書く>>
hist(CO2$conc)

<<箱ひげ図を書く>>
boxplot(CO2$conc)

 なんてことをする。




■2変数の基本的な統計量(数値)

 2変数の関係を見たい場合、両方とも数値であれば、相関係数ないしは共分散をもとめ、散布図を書く。

<<相関係数>>
cor(CO2$conc,CO2$uptake)

<<共分散>>
cov(CO2$conc,CO2$uptake)

<<散布図>>
plot(CO2$conc,CO2$uptake)




■2変数の基本的な統計量(選択肢)

 項目の場合は、クロス表を作る
<<クロス表>>
table(CO2$Type,CO2$Treatment)

 そうすると、なんか図にしてくれる。

<<図にする>>
plot(CO2$Type,CO2$Treatment)





 ちなみに、数値と選択肢の組み合わせの場合でplotすると

plot(CO2$Treatment,CO2$uptake)

こんな、項目毎の箱ひげ図を出してくれる。

 また、ただCO2だけでプロットすると

plot(CO2)

 こんなふうになる。






  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

品質管理の分野で最近話題の「ゆるひん」のマスコットってこれ?

2013-06-21 15:02:30 | Weblog

軽量品質だとかLightweightQAという用語はよくない。ミッションクリティカルの組織で技術が分かってないオヤジが、品質コストを下げるための道具と誤解しやすいから。


ということで、

このコンセプトは基本的に、品質技術が低く、時間がなく、人数がおらず、期間が短く、要求品質が高くない状況を想定している。そういう組織にしか選んで欲しくない戦略なので、そういう組織にいる人が意図を理解して使ってくれるような名前にすべき。で、森さん提案の「ゆるひん」を採用。


ということになった、「ゆるひん」

詳しくは、このあとの西先生のツイートをみてもらうことにして、

https://twitter.com/YasuharuNishi


「ゆるひん」のマスコットキャラって、どれ?
Tweetから、「なまけもの」でないことはわかるんだけど・・・

コレ?

それとも

これ?


P.S
マスコットキャラ探しは、

話題の「ゆるひん」議論は、基本価値を満たしていないソフトウェアでもよしとするのか、基本価値を満たしていることを保証するプロセスをリスクベースで間引くのか、それとも「この程度の基本価値でも実はニーズを十分に満たせるんじゃないですかお客さん?」と示すのか、どのあたりなのでしょう。

という話題が出てきた後、もうしていないのかしら・・・

(本エントリのリンクは、すべてリンク先からの引用)


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「RT、ダメ、ゼッタイ!」――ネット選挙運動、未成年者は禁止 by 総務省

2013-06-21 12:08:26 | ネットワーク
あ、そうなんだ・・・

「RT、ダメですよ」――ネット選挙運動、未成年者は禁止 総務省が注意呼びかけ
http://www.itmedia.co.jp/news/articles/1306/20/news057.html

公職選挙法違反ということは、RTすると、犯罪者として、罰せられる可能性があるということだな。


公開されているチラシ

http://www.soumu.go.jp/senkyo/senkyo_s/naruhodo/popup-chirashi02.html


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ビッグデータが入ったHDDをGoogleに送ると80ドルでクラウドにアップしてくれる

2013-06-21 10:07:23 | AI・BigData
Google Cloud StorageのOffline Disk Importっていうサービスのことだと思うけど・・・

Amazonに非常によく似たサービス〔日本から利用可能〕があり、料金もHDD1台あたり80ドルと同額だけど転送作業時間に応じた料金がかかる。5TBのデータをeSATAのHDDからS3にアップロードする場合、Amazonの計算よれば、別途45ドルが課金されるのに対して、Googleの定額制の方がはるかにお得とのこと。

ただし限定ベータテスト中なので対象はアメリカ国内に住所を持つユーザーに限られるそうなので、アメリカに支社があるような会社でないとできないかも・・

どちらかというと、クラウドにあるデータを社内に、もしくは他社クラウドに移転ということをしたいかと思うけど、それについてはAmazonはクラウド上のデータをHDDにエクスポートするサービスも実施しているが、今のところGoogleにはないそうです。


ビッグデータが入ったHDDをGoogleに送ると80ドルでクラウドにアップしてくれる
http://headlines.yahoo.co.jp/hl?a=20130619-00017580-techcr-sci

より(太字は上記サイトより引用)

また、サービスについての詳細は

Google Cloud Storage Offline Disk Import
https://developers.google.com/storage/docs/early-access


Amazonの同様のサービスは

AWS Import/Export
http://aws.amazon.com/jp/importexport/



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6月20日(木)のつぶやき

2013-06-21 04:28:38 | ネットワーク

「ビールを買ったら、「おむつもいかがですか?」とオジサン店員に言われたら、イヤでしょ?」 blog.goo.ne.jp/xmldtp/e/9665a…



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする