「PG（分散処理）」のブログ記事一覧(14ページ目)-ひしだまの変更履歴

SQL to AsakusaFW：INSERT

2019-12-07 00:00:00 | PG（分散処理）

Asakusa Framework Advent Calendar 2019の7日目、SQLをAsakusaFWに変換するポイントについてです。

SQLのINSERT文は、VALUESを使う構文とSELECTを使う構文があります。

まずINSERT-SELECTですが、これはSELECTした結果をINTOで示されたテーブルに入れるものなので、SELECT文をAsakusaFWに変換するのと同様（出力先データモデルが違うだけ）です。

一方、INSERT-VALUESは入力が何も無い状態からデータを出力することになりますが、AsakusaFWでは入力が無い場合の処理を記述することは出来ません。
（core.empty演算子は空のデータを出力しますが、それと似て1レコードだけ出力するcore.oneみたいな演算子が欲しいなーと思っているのですが＾＾；）
ただ、ダミーで1レコードだけ存在しているファイルをジョブフローの入力とし、それをExtract演算子に渡せば、Extract演算子は自由に複数レコード出力することが出来るので、INSERT-VALUESを実現できます。

それと、テーブル定義のデフォルト値の仕組みはAsakusaFWには無いので、VALUESで指定されていない項目に対するデフォルト値は自分でセットする必要があります。
これは簡単だから特に問題ないのですが、問題は、IDの自動採番の仕組みです。

AsakusaFWは分散して処理するので、全体を通して一意になる値を採番することは出来ません。
処理を行うサーバーのホスト名やUUIDなんかを組み合わせれば一意にすることは出来ますが、RDBの自動採番はほぼ数値なので、直接的な代替にはなりませんよね…。
なので、Oracle用ですが、そこだけJDBC接続してOracleのシーケンスで採番するユーティリティーを作ってみました。

SQL to AsakusaFW：DELETE

2019-12-06 00:00:00 | PG（分散処理）

Asakusa Framework Advent Calendar 2019の6日目、SQLをAsakusaFWに変換するポイントについてです。

SQLのDELETE文を考えてみましょう。
WHERE条件が無いDELETE文の場合、全件削除となります。AsakusaFWでは、入力データをcore.stop演算子に渡し、core.empty演算子で空データを出力するのが良さそうです。
というか、ただ単に何もしないということなので、わざわざAsakusaバッチにする必要は全く無いですね(爆)

WHERE条件が有るDELETE文の場合、Branch演算子で条件分岐し、削除する側をcore.stop演算子に渡すことになるでしょう。

ひとつ問題となるのは、RDBへの反映方法です。
たいていのRDBを扱うAsakusaバッチの場合、出力結果をRDBに反映することになると思います。

INSERTやUPDATEの場合は出力したデータをテーブルに反映（上書き）すればいいですが、DELETEではそういうわけにいきません。RDB上の既存データと比較して存在チェックをし、無いものを実際にDELETEすることになりそうですが、面倒ですよね…。

削除したデータをcore.stop演算子に渡すのではなく削除済みデータとして出力しておけば、そのプライマリキーを元に（AsakusaFW以外のツールで）DELETE文を発行するという方法が使えます。こちらの方が幾分簡単な気がします。

なお、AsakusaFWのWindGate JDBCを使っている場合は、RDBへの反映はTRUNCATE（全件削除）+全件INSERTなので、DELETEだからと言っても特別な考慮をする必要はありません。

SQL to AsakusaFW：UPDATE

2019-12-05 00:00:00 | PG（分散処理）

Asakusa Framework Advent Calendar 2019の5日目、SQLをAsakusaFWに変換するポイントについてです。

SQLのUPDATE文はテーブルの（一部の）カラムを更新するので、AsakusaFWのUpdate演算子で実現できます。
別テーブルのデータを用いて更新する場合は、CoGroup演算子等で結合して更新します。

あと、RDBMSのトリガーのような機能はAsakusaFWには無いので、必要であれば別途コーディングする必要があります。

SQL to AsakusaFW：SELECT

2019-12-04 00:00:00 | PG（分散処理）

Asakusa Framework Advent Calendar 2019の4日目、SQLをAsakusaFWに変換するポイントについてです。

SQLで最も使われるのはSELECT文だと思います。
SELECT文ではテーブルの結合やWHERE条件・集約など色々なことが出来ますが、それは後日取り上げるとして、今日はSELECT句に絞ります。
SELECT句とは「SELECT col1, col2, …」という部分のことです。

AsakusaFWに変換するときは、SELECTする項目だけを表すデータモデルを作って出力する形になるでしょう。
FROM句（あるいは集約の場合は集約結果）を表すデータモデルから、SELECT句で出力する項目の演算を行って出力します。
これにはAsakusaFWのConvert演算子がぴったりです。

SQL to AsakusaFW：テーブル

2019-12-03 00:00:00 | PG（分散処理）

Asakusa Framework Advent Calendar 2019の3日目、SQLをAsakusaFWに変換するポイントについてです。

SQLをAsakusaFWに変換するに当たって、まず必要なのはテーブルですね。
AsakusaFWでテーブルに相当するのはデータモデルです。
元々AsakusaFWはWindGate JDBCでテーブルをデータモデルとして読み書きすることができるので、それに準じます。

RDBの基本的なデータ型はAsakusaFWのDMDLのデータ型に対応するものがありますが、TIMESTAMP（秒より小さい単位、すなわちミリ秒やマイクロ秒）に直接対応するデータ型はAsakusaFWには無いので、必要であればTEXT等で代用することになります。

BLOB等のバイナリーや配列（ARRAY）は使えません。
もし配列を使いたいなら、JSONにでもして、TEXTとして保持するとか…？

また、AsakusaFWに制約（NOT NULLやUNIQUE等）の機構はありません。
必要であれば、そのチェックロジックを自分でコーディングする必要があります。

テーブル（データモデル）の結合にはAsakusaFWを実行する基盤（SparkやM3BP）のシャッフル機能を使うので、テーブルのインデックスは必要ありません（インデックスのような仕組みはありません）。

プロフィール

自己紹介: 自分のホームページの変更履歴を書くのに、ブログがちょうどいいかなーと思って登録しました。
TRPGリプレイの元ネタ集とかプログラミング技術メモ・自作ソフトやゲーム・音楽その他興味あることなど～。

カレンダー

前月

次月

バックナンバー

2025年04月

2024年12月

2024年09月

2024年03月

2023年12月

2023年10月

2023年09月

2023年06月

2023年05月

2023年03月

2023年01月

2022年12月

2022年09月

2022年03月

2021年12月

2021年09月

2021年03月

2021年02月

2020年12月

2020年11月

2020年09月

2020年06月

2020年05月

2020年03月

2019年12月

2019年11月

2019年09月

2019年06月

2019年03月

2018年12月

2018年10月

2018年09月

2018年08月

2018年07月

2018年06月

2018年04月

2018年02月

2018年01月

2017年12月

2017年11月

2017年09月

2017年08月

2017年07月

2017年06月

2017年05月

2017年04月

2017年01月

2016年12月

2016年11月

2016年10月

2016年09月

2016年07月

2016年05月

2016年04月

2016年03月

2016年02月

2016年01月

2015年12月

2015年11月

2015年10月

2015年09月

2015年08月

2015年07月

2015年06月

2015年05月

2015年04月

2015年03月

2015年02月

2015年01月

2014年12月

2014年11月

2014年10月

2014年09月

2014年08月

2014年07月

2014年06月

2014年05月

2014年04月

2014年03月

2014年02月

2014年01月

2013年12月

2013年11月

2013年10月

2013年09月

2013年08月

2013年07月

2013年06月

2013年05月

2013年04月

2013年01月

2012年12月

2012年11月

2012年10月

2012年09月

2012年08月

2012年07月

2012年06月

2012年05月

2012年04月

2012年03月

2012年02月

2012年01月

2011年12月

2011年11月

2011年10月

2011年09月

2011年08月

2011年07月

2011年06月

2011年05月

2011年04月

2011年03月

2011年02月

2011年01月

2010年12月

2010年11月

2010年10月

2010年09月

2010年08月

2010年07月

2010年06月

2010年05月

2010年04月

2010年03月

2010年02月

2010年01月

2009年12月

2009年10月

2009年09月

2009年07月

2009年06月

2009年05月

2009年04月

2009年03月

2009年02月

2009年01月

2008年12月

2008年11月

2008年10月

2008年09月

2008年08月

2008年07月

2008年06月

2008年05月

2008年04月

2008年03月

2008年02月

2008年01月

2007年12月

2007年11月

2007年10月

2007年09月

2007年08月

2007年07月

2007年06月

2007年05月

2007年04月

2007年03月

2007年02月

2007年01月

2006年12月

2006年11月

2006年10月

2006年09月

2006年08月

2006年07月

2006年06月

2006年05月

2006年04月

2006年03月

ブックマーク

goo: 最初はgoo

goo blog お知らせ

	【11/18】goo blogサービス終了のお知らせ
	【PR】ドコモのサブスク【GOLF me！】初月無料
	【コメント募集中】goo blogでの思い出は？
	「#gooblog引越し」で体験談を募集中