MIT’s blog

個人的なメモかな

キー項目

JRA-VANの提供データは仕様書なんかで諸々の定義がされてます。そんな中でキーにする項目で微妙な記述があります。馬毎レース情報のキーなんですが、馬番をキーにするか否か。

出走馬名表時点では、全て初期値を設定(出馬表時点で馬番が埋まるため、馬番を純粋に
キー設定すると、同一馬の情報が重複する)
ただし、レースによっては枠番・馬番を設定している場合がある

海外レースにおいては、馬番が不明の場合は初期値を馬番として入力
なお、過去のレースでは連番を設定しているものがあるため、血統登録番号をキーとして
使用する


こんなんで、悩んでました。馬番をキーから外して昨夜フルセットアップして寝て、今朝から最適化。しかし、キーから外すと海外レース情報なんかで問題が有り、元に戻す。こんな繰り返しで再度フルセットアップしてますが、以前の様に14時間とか掛かってたのが2時間程度なのは本当に助かる。

で、多分問題になるのは出馬表確定前の提供データでは馬番が無い状態で、その後に馬番確定して提供されるのでキーとして馬番違う為、同一馬に対して2つのレコードが存在してしまう。これをどの段階でチェックして削除するか考えてみます。