« 2011年6月 | トップページ | 2013年2月 »

2012年4月

2012-04-24

とりあえず51208局

しまさん提供の棋譜でデータベースを作り直しました。

【今回の変更点等など】
・棋譜数が約2300局ほど増えました。
 しかし、しまさんより頂いたのは51265局、今回使われたのは51208局。57局ほど今回は使ってません。変換スクリプトで正しく読めなかっただけなので、棋譜に修正をいれるなりすれば全部読める筈。データベースの仕様見直し後にそれらも取り込みます。

・棋譜再生ページからの棋譜ファイル(KI2)へのリンクが無くなりました。

・2ちゃんねる棋譜番号を無くし、オリジナルなID番号に。
 これも暫定的な物でデータベース仕様見直し後にまた変わる可能性もあります。

・棋士名が変わっている
 以前4文字未満の棋士名には全角スペースが入ってましたが、今回は入っていないようです。
  (例)「藤井 猛」→「藤井猛」
 また、山﨑隆之先生、髙野秀行先生の「﨑」と「髙」の字が変わっています。(※)
 検索時には注意が必要です。

※さて、懸念してた「高・崎」の問題、charsetをshift-jisで出力してるけど、SafariにしてもFirefoxにしても、ちゃんとCP932として処理してくれるんでしたね。
表示されるけれどやっぱりなんかすっきりしないので、UTF-8化したい。。。

| | コメント (0) | トラックバック (0)

2012-04-23

とりあえず以前の仕様で

やっぱり文字コードは表示にUTF-8使うにしても内部はCP932のままでいいかなあとか、戦型や戦術など今回の棋譜に入れられてるデータ利用して項目増やそうかなあなどと、仕様を未だに決め切れていないので、とりあえず今動いてるDBの仕様のまま棋譜データだけ取り込む作業だけ先に行うことにした。

今から作業開始。
「高」と「崎」はとりあえず放置および元のKI2ファイルの閲覧も使えないことになるけど、あくまで暫定処置。新しい仕様決めて新しいのをなるべく早く作る方向で。

あと、このブログのカテゴリーに「棋譜DB」を追加。

| | コメント (0) | トラックバック (0)

2012-04-21

Shift-JISからUTF-8に

今回棋譜変換してみるとなにか「見えない」おかしな文字があることに気が付きました。さぐってみると山崎先生と高野先生の「立つ崎」と「はしご高」の2文字でした。
普通Shift-JISではこの2文字存在しません、がwindowsには存在します。つまり厳密にいうとShift-JISとも違うわけです。この辺の詳しいことは他のサイト等におまかせするとして、では棋譜DBでどうするか。

サイトの表示もデータベース内部のテキストのコードもShift-JISで作っていました。これはkifファイル自体の文字コードがShift-JISだったからなんですが、Shift-JISではないとなると話はかわります。
結論だけ言うと、表示もDB内部もUTF-8を使うことにします。

| | コメント (0) | トラックバック (0)

2012-04-20

棋譜DB

1年程前に大枠だけ作って完全に放置されていた棋譜データベースサイト。

今回、大生将棋のshima.さんの協力により棋譜を追加できることとなりました。

これまでは「2ちゃんねる棋譜」のみを使用していたため、最近の棋譜がありませんでした。その問題がshima.さんの協力で解決出来そうとなると、開発意欲も自ずと復活します。

さて、肝心の棋譜をまずどっさり頂いたのですが…。棋譜変換するだけだと思ってたけど、実際にサイト作ってたのはほぼ1年前。いろいろ思い出しながら作業してると、新たに気が付くことなども。そうだ!メモ残しておこうと、ここを思い出しました。

作業記録とかメモとかここに残していきますわ。

| | コメント (0) | トラックバック (0)

« 2011年6月 | トップページ | 2013年2月 »