昨年末『livedoor Blog 開発日誌』上に公開された「年末年始を写そう!livedoor ピクスリニューアル、トラックバックスパム防止につきまして」に関する記事を読んで、今月10日より「トラックバック先ブログのURLを含まないトラックバック送信を許可しない」ように、livedoor Blogのサーバの仕様が変更されると勘違いして書き始めた記事です。
実際には、昨日の「トラックバックスパム防止機能の導入につきまして」の記事にあるように、恐らく「リンクを含む受信トラックバックのみ許可する」というよくあるオプションの導入と既定値化だけのようなのですが、捨てるのもったいなくなったので、取り敢えず公開しておきます。
:
livedoor Blogがトラックバックサーバの仕様を変更して、「トラックバック先ブログのURLを含まないトラックバック送信を許可しない」というのは、本当だろうか。該当記事のURLはおろか当該ブログのURLであっても、Trackback Ping-URLだけから確実に導き出す手段はなく、記事内にブログのURLが含まれるかどうかの判定精度は、非常に怪しい。
ということは、「リンクを含まないトラックバックを許可しない」範囲がlivedoor Blog内に限定される(他サイトはノーチェックのままな)のか、livedoor Blogのサーバからトラックバックを送信できるのがTrackback Auto-Discovery対応で記事ページにRDFメタデータ※を埋め込んでいるサイト限定に変更されるのか、どちらかではないかと推測される。
何故なら、トラックバック元記事内にトラックバック先記事のURLが含まれ、トラックバック先ページにRDFメタデータが埋め込まれていれば、Trackback Ping-URLとトラックバック先記事URLの比較ができるからである。
また、livedoor Blog内に限定するなら何でもできるだろうし、Trackback Ping-URLのRSSモード†で記事のURLが拾える場合もあるようです。
ということで、hxxk.jpの「各種 weblog の URI 設計を比較してみる」に載っていた主なブログサービスに関して、Trackback Ping-URLと当該記事URLの関係や、Trackback Ping-URLのRSSモード対応状況、RDFメタデータ埋め込みの有無などを調べてみた。
なお、同記事のWeblogツールについては残念ながら調べていないので、教えていただければ助かります。
資料1
- livedoor BlogのTrackback Ping-URL規則
- エキサイトブログのTrackback Ping-URL規則
- JUGEMのTrackback Ping-URL規則
- ココログのTrackback Ping-URL規則
- FC2ブログのTrackback Ping-URL規則
- SeesaaブログのTrackback Ping-URL規則
資料2
- アメーバブログのTrackback Ping-URL規則
- gooブログのTrackback Ping-URL規則
- ドリコムブログのTrackback Ping-URL規則
- ヤプログのTrackback Ping-URL規則
- Yahoo!ブログのTrackback Ping-URL規則
- DoblogのTrackback Ping-URL規則
- はてなダイアリーのTrackback Ping-URL規則
記事内の主な用語定義
- TrackbackPingUrl
当該記事に対してトラックバックPingを送信するためのURL。
- EntryUrl
当該記事の固定リンクURL(PermaLink)。
- UserName
英数字や記号で構成される、同一ブログサービス内でブログの識別に使われるユーザ名の文字列。
- BlogName
英数字や記号で構成される、同一ブログサービス内でブログの識別に使われる文字列。
ブログサービスのユーザ名とは異なる値。
- BlogID
英数字や記号で構成される、ブログシステムが付与するブログの識別子。
同一ブログシステム(ブログサービス)内でユニーク。
- SystemEntryID
英数字で構成される、ブログシステムが付与する記事の識別子。
同一ブログシステム(ブログサービス)内でユニーク。
- UserEntryID
英数字で構成される、当該ブログが付与する記事の識別子。
同一ブログシステム(ブログサービス)内ではユニークとは限らない。
- yyyy
4桁の数字で表される西暦年。
- mm
2桁の数字で表される月。
- dd
2桁の数字で表される日。
- Hour
1桁以上の数字で表される時。
- HH
2桁の数字で表される時。
- MM
2桁の数字で表される分。
- SS
2桁の数字で表される秒。
- UnixTime
1970年01月01日00:00:00(UTC)からの経過秒数。
- Number
正の整数。
- xx
2桁の16進数。
- xxxxxxxx
8桁の16進数。
- EnrtyTitle
記事のタイトルの文字列。
- TitleBasedString
記事の初期タイトルを元に生成される文字列。
- AuthorUserName
英数字や記号で構成される、同一ブログサービス内で投稿者の識別に使われるユーザ名の文字列。
複数ユーザの投稿を許さないシステムでは、UserNameと等価。
- AuthorHandle
投稿者の愛称を意味する任意文字列(ハンドル)。
- AnyString
任意の文字列。
※ RDFメタデータ
Trackback Auto-DiscoveryのためのRDFメタデータは、<rdf:RDF ... ><rdf:Description ... /></rdf:RDF> という形式で、XMLのバリデータエラー(妥当性エラー)となることを避けるために、多くの場合は<!--と-->で括りコメントアウトしている。
† Trackback Ping-URLのRSSモード
TrackbackPingUrlの後に?__mode=rssというクエリ文字列を付加してHTTP GETリクエストすると、当該記事のURLや受信トラックバックの一覧をRSSマークアップ形式で取得できる(少なくともMovable Type互換なら)。
Trackback Ping-URLと記事のURL 資料1 2006年01月07日01:23
Trackback Ping-URLと記事のURL 資料2 2006年01月07日02:34
各種 weblog の URI 設計を比較してみる - hxxk.jp 2005年11月15日18:50
livedoorがスパムトラックバック送信対策? 2006年01月05日00:09
年末年始を写そう!livedoor ピクスリニューアル、トラックバックスパム防止につきまして - livedoor Blog 開発日誌 2005年12月28日17:52
トラックバックスパム防止機能の導入につきまして - livedoor Blog 開発日誌 2001年01月06日11:56
トラックバック Ping URL の自動検知 - トラックバック技術仕様書 2002年10月10日(最終更新2005年05月23日21:58)
● 2006年01月08日追記
資料の形式と内容を、Trackback Auto-Discoveryに対応しているかどうかから、Trackback Auto-DiscoveryのためのRDFメタデータが存在するかに重点を置くように変更した。
● 2006年01月12日追記
資料に、Trackback Ping-URLのRSSモード(TrackbackPingUrl?__mode=rss)で当該記事URLを取得できるかどうか追加した。
あとで更新するかも。
gooブログの原稿上限10,000文字制限(タグを含む)に引っかかり、かなりヘトヘト。
お疲れさまでした。
RDFメタデータ(rdf:Description)がないブログも存在するんですね。 必須だと思っていたので少し驚きです。
でわでわ。
あとは、自動化されたスパムへの対策として、わざと削除するのも手かなぁと、最近は思ってます。
>お疲れさまでした。
どもです。gooブログはタグを含めて10,000字/記事なので、rdf:Descriptionの属性を追加して太った資料が、なかなか「再投稿」できなくて…。
これ以上何か項目を追加する場合は、資料1も2も分割しなおしが必要になりました(わは)。