Apache Jenaで大量のRDFトリプルをTDB(2)にバルクロードする
tdbloader2を使って大量のRDFトリプルをロードするとき、インデクシングフェーズで大きな一時ファイルが作成されるため、/tmpの容量不足で失敗することがあります。 1 2 3 4 5 6 7 8 $ tdbloader2 --jvm-args "-Xmx8g" --loc /path/to/database *.ttl INFO Total: 98,355,483 tuples : 4,089.41 seconds : 24,051.26 tuples/sec [2019/03/22 04:15:47 JST] 04:15:48 INFO Data Load Phase Completed 04:15:48 INFO Index Building Phase 04:15:48 INFO Creating Index SPO 04:15:48 INFO Sort SPO sort: write failed: /tmp/sortvNPO1J: No space left on device 04:18:36 ERROR Failed during data phase Apache JenaJENA-1003: tdbloader2 reports df: `’: No such file or directory こちらを見ると、TMPDIRという環境変数を設定することでtmpディレクトリを指定できるようです。 ...