2014年6月のブログ記事一覧-ひしだまの変更履歴

TypeScriptリファレンスのようなScala入門が欲しい

2014-06-22 12:26:27 | PG（JavaScript）

わかめさんから『TypeScriptリファレンス』をいただきました。ありがとうございます！
遅くなりましたがようやく一通り読み終わったので感想を書きます。

TypeScriptはJavaScriptに型を加えたような感じの言語。コンパイルするとJavaScriptを生成する。つまり、コンパイル時に型チェックが行われる。
ある程度以上の規模のアプリケーションを作るなら型チェックくらいはコンピューターにやってもらわないとプログラミングするのがつらいので、JavaScriptを使わないといけないならTypeScriptはとても便利そう。

『TypeScriptリファレンス』は、頭から順番に読んでいくとTypeScriptのことがよく分かるようになっている。
最初にインストール方法や開発環境（IDE）の構築方法についても載っていて、IDEについてはVisual Studioが基本なようだが、他にWebStorm・Eclipse・Emacsまで紹介されているｗ

また、随所に「JavaScriptはこういう仕様だがTypeScriptはこうなっている」「TypeScriptからこんなJavaScriptが生成される」という説明が入っていて、JavaScriptについても詳しくなれる。
TypeScript自身はJavaScriptをベースにしていてJavaScriptを生成する言語なので、JavaScriptに似ている部分もあれば異なる部分もある。JavaScriptとの相互運用性が高い反面、JavaScriptの欠点も多少引き継いでいるのだが、そういった点もちゃんと説明されているのが良い。

それにしても、『TypeScriptリファレンス』は入門書として非常に読みやすい。
Scalaの入門書としてこのような本が欲しいと思うし、自分がJavaを初めて勉強したときにもこんな本があれば良かったなぁと思った。（自分がJavaを勉強し始めた頃は、Javaアプレットが主流で、Javaそのものの入門書は少なかったorz）
ちなみに、TypeScriptがJavaScriptをベースにして拡張した言語だという点は、ScalaとJavaの関係に似ている。いっそTypeScriptの名前がScalaScriptだったら（混乱を招いて）面白かったかもしれない(爆)

最後に、ひとつだけ本書に対して苦言を呈するならば、vvakameアイコンがどこにも描かれていないのは何故なのでしょうか(真顔)
カバーの裏までチェックしたのに、無い…！orz

AsakusaFW0.6.2 小さなジョブを速く！

2014-06-08 15:06:01 | PG（分散処理）

2014/5/22にAsakusa Framework0.6.2が出ていて、ブログを書こうと思っていたのに、忙しくて延び延びになってた＾＾；
→リリースノート
（ちなみに忙しくてもDQ10の日課はやってるよ、あれは精神安定剤のようなものだから、むしろやらねばならんｗ）

今回は主に運用環境（実行時の設定）周りの機能が増えている。

まず注目したいのは、「小さなジョブ」に関する最適化。

Asakusaアプリケーションの場合、複数のファイルを結合したりするので、少量多種のファイルを扱うことがよく出てくる。これはHadoopの本来の使途からすると外れていて、Hadoopの苦手とするところorz
入力データサイズが小さい（理想的にはすぐ終了するはずの）ジョブであっても、Hadoopのタスク起動にはそれなりの時間（いわゆるHadoop税）がかかるので、遅い。
特にタスクは分散しているのだけれどもそれぞれのタスクの出力量は少ない場合、小さいファイル（最悪の場合は0バイトのファイル）が大量に出来てしまう。後続ジョブではファイル数（ブロック数）分のMapタスクが作られるので、無駄な時間の累計が増えてしまう。
そこで、1つのMapタスクで複数のファイル（入力スプリット）を読むようにすれば、総体としてHadoop税が減る。→入力スプリットの結合
また、Reduceタスク数を減らせば、出力ファイル数（後続ジョブに渡るファイル（スプリット）数）も減らせる（1タスクが1ファイル出力するので）。→Reduceタスクの調整

これらのタスク数を調節する為のオプション（ファイルサイズの閾値）が指定できるようになった。

それと、対応プラットフォームについては、Hadoop2系（CDH5）が増えてきた。

Hadoop2系にはuber mode（ユーバーモード。uberはドイツ語？）というのがあるらしく、これを使うと小さなジョブの実行をHadoop側でも速くできるらしい。

uberモードについては（象本第3版には載っているらしいが）よく知らないので以下は憶測だが。
通常のHadoop2（YARN）では、アプリケーションマスター（AM）がタスク実行用のコンテナーを起動してジョブを実行する。（JobTrackerとTaskTrackerの関係と同様で、コンテナーは別マシン上に別JavaVMを起動して動く）
ただ、条件を満たした場合（概ね、タスク数が少なくて入力データが小さくてメモリーに乗り切ること？）は、アプリケーションマスターが直接ジョブを実行する（AMと同じJavaVM上でジョブを動作させる）ことによって、コンテナー起動のコストを抑えるらしい。これがuberモード。

AsakusaFWでもジョブの振り分け機能で小さなジョブをスタンドアローンHadoopに振り分けることによってHadoop税を軽減させる方策があったけど、それをHadoopが自動的に実施してくれる感じかな？

つまり、AsakusaFWの「小さなジョブの最適化」とuberモードが組み合わさると、いい感じになるかも？！

あとは、YAESSログの可視化ツール！

Asakusaアプリケーションは複数のHadoopジョブに分かれるので、実行時間を解析するときは、ジョブ毎の実行時間を調べるのが最初のステップ。
その為にYAESSログからジョブの開始と終了の行を抽出して…ということをよくやっていたのだけれど、それをやってcsvファイルにして出力してくれるらしい！
gradlewコマンドを使うということは、実行環境で出力されたYAESSログを開発環境にコピーしてくる必要はある。
レポートファイルの例には実行時間を表す棒グラフも付いているけど、csvファイルにそんなものが入れられるわけが無いから、これはExcelの機能でこういう事も出来るという例だろう。

Java8でScala不要論？

2014-06-08 11:40:10 | PG（Java）

たぶんジョークだと思うんだが「Java8があったらScalaが不要になる」みたいな事を言っている人がいて、本気だとすると、Java8もScalaも見たことないのに言ってるだけだと思う。
ということで一応マジレス？しておく(笑)

Java8でインターフェースにメソッド（デフォルト実装）が持てるようになった。

Java8のインターフェースは可視性にpublicしか指定できないが、Scalaのトレイトはpublic以外も可。
Java8のインターフェースはフィールド（static finalな定数以外）を持てないが、Scalaのトレイトは持てる。

Java8でStreamが導入された。

Java8ではプリミティブ用のStreamとオブジェクト用のStreamがあり、mapもそれらに応じてmapToObjやmapToInt等のメソッドがあり、使い分けなければならない。Scalaは全てmapメソッドで出来る。
Java8のStreamにはzipやdrop・takeWhileといったメソッドが提供されていない。
Java8のStreamのflatMapはStreamを返す関数しか渡せない。ScalaのflatMapはListでも配列でもOK。
Java8のStreamは、Listに変換するにはcollectメソッド（Collectors.toList）を使う。ScalaはtoListというメソッドを使う（メソッド名が分かり易いし短い）。
Java8ではStream以外のコレクションにはmapやfilterといったメソッドは追加されていない。ScalaではStream以外のコレクションにもある。

ラムダ式

Java8では変数名が外部スコープと同じになる（ラムダ式の引数に外部と重複した変数名が使えないのは痛い）。
Java8ではラムダ式の本体から外部スコープの変数にアクセスする場合はその変数がfinalである必要がある。Scalaでは外部スコープの変数の値も書き換えられる。
Java8では複数の文を書いたらreturnを書く必要がある。
Scalaにはプレースホルダーがある。

Optional

Java8のOptionalは、ScalaのOptionとほぼ遜色ないかな。
Java8では（Streamと同様に）プリミティブ用のOptionalIntとかがあって、オブジェクト用のOptionalと相互変換できないのが不便だけど。

メソッド参照

Scalaでもメソッドを関数として渡すことは出来るが、見た目は（通常のメソッド呼び出しなのか関数オブジェクトを渡しているのかは）分かりにくいかもしれない。

コンストラクター参照

Scalaにはコンストラクター参照に当たるものは無い気がする。強いて言えば、コンパニオンオブジェクトのapplyメソッド（コンストラクターの代わり）を関数として渡せるが。

Streamのメソッドが足りない件については、最初は最小限にして、後から追加していくつもりなんじゃないかと思う。（最初から多すぎてもどれを使えばいいのか迷うだけだし＾＾；）

Stream以外のコレクションにmapやfilterといったメソッドが無いのは、実行性能や理念の問題で敢えて入れていないのだろう。
（例えばListの場合は、もしmapが即時評価だったらmapを複数チェーンすると実行速度が遅くなる。そうなっていたらStreamを介すのが解決策になるわけで、結局Stream以外のmapは使われなくなるだろう）
（例えばListのメソッドは自分自身を操作するので、filterの代わりにremoveIfといったメソッドが加わっていたりする。（filterは、値をフィルタリングした新しい集合を返す。removeIfは、指定された条件で自分自身の中から削除する））

そういや、int用のStreamはIntStreamなのに、int用のOptionalがOptionalInt（「Int」の付く位置が違う）なのは何故だ？＾＾；

Javaは、バージョン間の上位互換を非常に重視している。（以前のバージョンで書いたソースやコンパイルしたクラスがそのまま新バージョンで動作することを目指している）
その制約の中では、上記に挙げた欠点も、妥当な選択の産物だとは思う。

プリミティブ用のStreamを用意したり、mapToIntやmapToObjによってStreamの種類を変換したりするのも、よく考えたなぁと感心する。
でも使う側からすると、Scalaより面倒なことに変わりはない(苦笑)

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

プロフィール

自己紹介: 自分のホームページの変更履歴を書くのに、ブログがちょうどいいかなーと思って登録しました。
TRPGリプレイの元ネタ集とかプログラミング技術メモ・自作ソフトやゲーム・音楽その他興味あることなど～。

カレンダー

2014年6月
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

前月

次月

バックナンバー

2024年03月

2023年12月

2023年10月

2023年09月

2023年06月

2023年05月

2023年03月

2023年01月

2022年12月

2022年09月

2022年03月

2021年12月

2021年09月

2021年03月

2021年02月

2020年12月

2020年11月

2020年09月

2020年06月

2020年05月

2020年03月

2019年12月

2019年11月

2019年09月

2019年06月

2019年03月

2018年12月

2018年10月

2018年09月

2018年08月

2018年07月

2018年06月

2018年04月

2018年02月

2018年01月

2017年12月

2017年11月

2017年09月

2017年08月

2017年07月

2017年06月

2017年05月

2017年04月

2017年01月

2016年12月

2016年11月

2016年10月

2016年09月

2016年07月

2016年05月

2016年04月

2016年03月

2016年02月

2016年01月

2015年12月

2015年11月

2015年10月

2015年09月

2015年08月

2015年07月

2015年06月

2015年05月

2015年04月

2015年03月

2015年02月

2015年01月

2014年12月

2014年11月

2014年10月

2014年09月

2014年08月

2014年07月

2014年06月

2014年05月

2014年04月

2014年03月

2014年02月

2014年01月

2013年12月

2013年11月

2013年10月

2013年09月

2013年08月

2013年07月

2013年06月

2013年05月

2013年04月

2013年01月

2012年12月

2012年11月

2012年10月

2012年09月

2012年08月

2012年07月

2012年06月

2012年05月

2012年04月

2012年03月

2012年02月

2012年01月

2011年12月

2011年11月

2011年10月

2011年09月

2011年08月

2011年07月

2011年06月

2011年05月

2011年04月

2011年03月

2011年02月

2011年01月

2010年12月

2010年11月

2010年10月

2010年09月

2010年08月

2010年07月

2010年06月

2010年05月

2010年04月

2010年03月

2010年02月

2010年01月

2009年12月

2009年10月

2009年09月

2009年07月

2009年06月

2009年05月

2009年04月

2009年03月

2009年02月

2009年01月

2008年12月

2008年11月

2008年10月

2008年09月

2008年08月

2008年07月

2008年06月

2008年05月

2008年04月

2008年03月

2008年02月

2008年01月

2007年12月

2007年11月

2007年10月

2007年09月

2007年08月

2007年07月

2007年06月

2007年05月

2007年04月

2007年03月

2007年02月

2007年01月

2006年12月

2006年11月

2006年10月

2006年09月

2006年08月

2006年07月

2006年06月

2006年05月

2006年04月

2006年03月

ブックマーク

goo: 最初はgoo

goo blog お知らせ

	goo blogは20周年を迎えました！
	訪問者数に応じてdポイント最大1,000pt当たる！
	皆さんにおすすめしたい人気ブログをご紹介
	今週のお題「#ガーデニング」をチェック