tdbloader2を使って大量のRDFトリプルをロードするとき、インデクシングフェーズで大きな一時ファイルが作成されるため、/tmpの容量不足で失敗することがあります。
|
|
Apache JenaJENA-1003: tdbloader2 reports df: `’: No such file or directory
こちらを見ると、TMPDIR
という環境変数を設定することでtmpディレクトリを指定できるようです。
|
|
これで無事ロードも終わり、さてFusekiを起動しようと思ったところ…
Server ERROR Exception in initialization: caught: File size (1852784650) not a multiple of blocksize (8192)
というエラーが出て小一時間悩んでいたのですが、tdbloader2はTDB2ではなくTDB用のツールだったんですね。コマンド名に"2"と付いているのでTDB2のデータベースが作成されると誤解して、TDB2としてロードしようとしたために発生したエラーでした。
TDB2用のコマンドラインツールは以下のページにあるように、“tdb2.“で始まるコマンドです。
今更TDBを使う理由もないので、tdb2.tdbloaderを使ってやり直します。
|
|
そこそこマシンスペックがあるなら--loader=parallel
を指定してやると、多少処理が早くなります。