やってみた。以下ソースと実行結果
前回の続き
統計解析フリーソフト R の備忘録頁 ver.3.1
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
や
Rで統計 - R入門
http://home.hiroshima-u.ac.jp/chubo/index.cgi?R%a4%c7%c5%fd%b7%d7
をもとに、Rを勉強してみる。
もう、順番めちゃくちゃになってきたけど、今回はデータ操作。
RDBなんかだと、選択、射影、結合ができる
選択とは
条件にあった「行」のみ取り出すこと
射影とは
自分が見たい「列」だけ取り出すこと
結合は
2つにテーブルを連結すること(列をつなげる)
今回は、この操作について、行いたい。
■選択
行を選択するには、subsetを使います。
subset(データ,条件式)
例:subset(CO2,Type=="Quebec")
(もっと続いているけど、省略)
■射影
3とおりあります。
1.桁が連続しているとき
データ[開始桁:終了桁]
例:CO2[2:4]
2.桁が離れているとき:その1
data.frame(桁1,桁2,桁3・・・)
例:data.frame(CO2$Type,CO2$Plant,CO2$conc,CO2$uptake)
(桁の順番を変えてもOK)
3.桁が離れているとき:その2
subset(データ,条件式,select=c(桁1,桁2,・・・))
※条件式にTRUEをいれれば、全ての場合ということになり、
結局、射影(select部分の処理)をしていることになる。
例:subset(CO2,TRUE,select=c(Type,conc,uptake,Plant))
■結合
ようするにJOIN
データ1が、売上テーブル(項目:販売日時、商品コードなど)
データ2が、商品テーブル(項目:商品コード、商品名など)
のとき、データ1の商品コードと、データ2の商品コードを連結させて
(一致するレコードを結び付けて)
売上レコードに、商品名を結び付けたいような場合につかう
marge(データ1,データ2,by.x="データ1の結合桁名",by.y="データ2の結合桁名")
例:
今、data1に(id,Plant,Type,Treatment,conc,uptake)、
data2に(id,name)
が入っていて、data1のTypeと、data2のidを連結させて、data2の名前を取得したい場合
merge(data1,data2,by.x="Type",by.y="id")
subsetは結局subset(データ,条件式,select=c(項目・・・))なので、
SQLのSELECTの項目名を並べるところと、WHERE句にほぼ相当する。
また、mergeでJOINを行う。
なので、この2つだけを知っていれば、SQLに相当する操作はできる。
統計解析フリーソフト R の備忘録頁 ver.3.1
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
や
Rで統計 - R入門
http://home.hiroshima-u.ac.jp/chubo/index.cgi?R%a4%c7%c5%fd%b7%d7
をもとに、Rを勉強してみる。
もう、順番めちゃくちゃになってきたけど、今回はデータ操作。
RDBなんかだと、選択、射影、結合ができる
選択とは
条件にあった「行」のみ取り出すこと
射影とは
自分が見たい「列」だけ取り出すこと
結合は
2つにテーブルを連結すること(列をつなげる)
今回は、この操作について、行いたい。
■選択
行を選択するには、subsetを使います。
subset(データ,条件式)
例:subset(CO2,Type=="Quebec")
(もっと続いているけど、省略)
■射影
3とおりあります。
1.桁が連続しているとき
データ[開始桁:終了桁]
例:CO2[2:4]
2.桁が離れているとき:その1
data.frame(桁1,桁2,桁3・・・)
例:data.frame(CO2$Type,CO2$Plant,CO2$conc,CO2$uptake)
(桁の順番を変えてもOK)
3.桁が離れているとき:その2
subset(データ,条件式,select=c(桁1,桁2,・・・))
※条件式にTRUEをいれれば、全ての場合ということになり、
結局、射影(select部分の処理)をしていることになる。
例:subset(CO2,TRUE,select=c(Type,conc,uptake,Plant))
■結合
ようするにJOIN
データ1が、売上テーブル(項目:販売日時、商品コードなど)
データ2が、商品テーブル(項目:商品コード、商品名など)
のとき、データ1の商品コードと、データ2の商品コードを連結させて
(一致するレコードを結び付けて)
売上レコードに、商品名を結び付けたいような場合につかう
marge(データ1,データ2,by.x="データ1の結合桁名",by.y="データ2の結合桁名")
例:
今、data1に(id,Plant,Type,Treatment,conc,uptake)、
data2に(id,name)
が入っていて、data1のTypeと、data2のidを連結させて、data2の名前を取得したい場合
merge(data1,data2,by.x="Type",by.y="id")
subsetは結局subset(データ,条件式,select=c(項目・・・))なので、
SQLのSELECTの項目名を並べるところと、WHERE句にほぼ相当する。
また、mergeでJOINを行う。
なので、この2つだけを知っていれば、SQLに相当する操作はできる。
ダニエル・ガルシアの例だ。彼は以前グーグル・キャンパスの食堂の従業員だったが、仕事を失い路上に行き着いた。
シリコンヴァレーに広がる貧困
http://zasshi.news.yahoo.co.jp/article?a=20130624-00010002-wired-sci
より(このエントリ内の太字は上記記事より引用)
億万長者たちの巨額の取引とは無縁のシリコンヴァレーが存在する。そこは、貧困と段ボールのテント村だ。フェイスブックやアップルの立派なビルやグーグルのキャンパスの足元にホームレスがいて、社会的不平等の代価を支払っている。この事実が、スタートアップとアメリカの未来が生まれるハイテクの世界を困惑させている。
このような話、この記事を見る以前に、どこかで見て、
そのときブログに書こうと思ったんだけど、
そのサイトをメモメモし忘れて、見失ってしまったのだが、
今回、また見つかった。よかった!
今度こそ、メモメモ・・・
シリコンバレーの裏側
http://j.ktamura.com/archives/18653
(以下斜体は上記サイトより引用)
Dropbox社のあるChina Basinビルからほんの2、3キロ南下したところにあるBayviewというエリアは、サンフランシスコきってのヤバいエリアである。SOMAにたくさんいるピチピチのDieselジーンズとRay Banのサングラスを身につけたヒップスターは姿を消し、薄汚れたパジャマのようなスウェットを履き、薄汚れたTシャツを着た黒人のホームレスが道路際に溢れている。路上にある車もボロボロの中古車で、銃痕のあるガラスもちらほら、家の窓には鉄格子がかかっている。
(中略)
町から町、地域から地域の貧富の差がとても激しいということだ。
いかにも中産階級の町San Brunoや、どこの王様のお屋敷だと思う家が立ち並ぶAtherton、蒼蒼とした街路樹が清然と並ぶPalo Altoと、その隣町で全米有数の犯罪都市のEast Palo Alto。富と貧困、カントリークラブとスラムが数キロ四方に共存している。
2013年10月23日~25日に開催される「第3回スマートフォン&モバイルEXPO 秋」に出展される予定だ。
とのこと
システナ、国内初の“Tizen”搭載タブレット端末を開発
http://headlines.yahoo.co.jp/hl?a=20130624-00000052-zdn_pc-prod
(太字は上記記事より引用)