Simpleエンジニア

システム開発の備忘録

7月23日(金)のつぶやき

2010年07月24日 00時07分55秒 | 日記
11:54 from Tween
うちの技術力で、スパムを弾くRSSリーダーでも作りますか RT @hirosuke_asano: RSSリーダーからニュースサイトに飛ぶとき、広告が表示されて直ぐ記事見れないのが最近多くなってきた。収益上広告はしょうがないかもしれないけど、ウザいものはウザいよね。
12:40 from Tween
地域判定エンジンを一般記事に適応するにあたり、
辞書の集め方や単語の切り方等まだまだチューニングすべき項目はたくさんある。
12:42 from Tween
が、根幹部分およびカスタマイズに柔軟性がある辞書というところは揺ぎ無くよい感じ。
19:37 from Tween
特定ルールの抜き出し方を少し強化した。
でもこれを思いつくのが定時過ぎてからなんだよなぁ。
もっともこれはデータが揃ってからでないと威力を発揮できない。
集めるの大変だ・・・
19:43 from Tween
MySQLのlongtextフィールドにSennaのインデックスを張っているが、
肥大化しときにインデックスが効かなくなるとか、検索速度が落ちるとかちょっと気になる。
だってlongtextって4GBまで格納できるって。びっくりした。
19:46 from Tween
社内のサンプルにて、単語抽出ロジックを少し変えてみた。
東京ドーム! サンフレッチェ広島!
19:50 from Tween
プロ野球オールスターはじまってる!
パ・リーグが4回までで1安打・・・だと・・・阿部にHRがでたらMVP確定だな。
このあと阿部が無安打で接戦だったら前田健がMVPだな。
セが勝てば、だけど。
by the_simple_1500 on Twitter