Kiwixとオフラインウィキペディア

こんにちは。

以前こちらの記事でEPWINGを使ったウィキペディアの電子辞書化について書きました。

今回はKiwixについて書きます。

2022年1月15日追記:Android版Kiwix(3.4.4)には記事が検索出来ないバグがあります。その解決策を追記しました。

Kiwixとは

「オフライン化のポイントって何なの?だってみんな24時間365日ネットに繋いでるじゃん!」

これは日本のような安定したインフラを持ち、自由民主主義国家に住む人にとって当たり前な意見だと思います。

しかし安定したインターネット接続環境と、政治的な検閲からの自由はこの世界の誰しもが享受出来るわけではありません。

仕事がなくデータ通信に料金を支払う余裕がない人、インターネットがしばしば切断される環境に住む人、政治的検閲を受ける人、そして災害によりインターネットが利用できない人へ向けてEmmanuel Engelhart氏とRenaud Gaudin氏が生み出したのがオープンソースで無料なオフラインウェブブラウザー、Kiwixです。

またKiwixはEmmanuel Engelhart氏により提唱される「水は共通の善(common good)であり、だからこそ我々は水に気を配る。同じようにウィキペディアも共通の善であり、我々はそれに気を配るべきで、ウィキペディアの内容は全ての人々がアクセスできなければならない。」という理念に基づきスイスを拠点に活動する非営利団体でもあります。

実際に使ってみよう

KiwixはパソコンとiOSでも利用可能なのですが、この記事ではAndroidでの利用について書きます(なぜなら私がAndroidでしか試してないからです)。

まずZIMファイルというファイルが必要になります。ZIMとはWiki形式のWEBサイトをオフライン化するのに特化したファイル形式で、すでに各種サイトのオフラインデータが公開されています。

私はこちらのサイトからウィキペディアのZIMファイルをダウンロードしました。「ウィキペディアをダウンロード」というところを押すと18GBのZIMファイルがダウンロードされます(2019/12/26現在)。分割されていないのでダウンロード後はそのまま利用できます。

AndroidやiOS向けのアプリ経由でもダウンロード可能です。ただし私はスマホで巨大ファイルをダウンロードしたくなかったのでパソコンから行いました。

ファイルのダウンロードが完了したらスマホへ移動させてください。私はSDカード内へ「Kiwix」というフォルダを作ってそこへ移動させました。注:この場合SDXCをexFATでフォーマットする必要があります

アプリでZIMファイルをダウンロードした場合、Androidだと「Android/data/org.kiwix.kiwixmobile/files/Kiwix/」内にZIMファイルが保存されますが、もしKiwixアプリを削除した場合このZIMファイルも削除されるので注意してください。ZIMファイルを残したい場合はどこでもいいので別の場所に移動させてからアプリを削除してください。

次にこちらからKiwixをインストールしてください。GooglePlayへのリンクです。そして起動させてください。はじめにアプリについて簡単な紹介がされます。

「GET STARTED」を押すと、既にZIMファイルをスマホ内に移していてもこの画面が表示されると思います。端末上のメディアアクセスについて尋ねられたら許可を押してください。そのまましばらく待つか一度終了させて再度立ち上げるとZIMファイルが読み込まれると思います。

無事読み込まれた場合はこのような画面になります。どれかタップすると利用できます。(この画面は人によります)

スマホ内にあるZIMファイルが読み込まれなかった場合や、これからアプリでダウンロードしたい場合は上記画像にある「DOWNLOAD BOOKS」を押してください。するとこの画面になりますので、ダウンロードしたい場合はお好きなものをタップしてください。SDカードを挿している場合はスマホの内蔵ストレージかSDカード内に保存するか選択肢が表示されます。既にZIMファイルがある場合は「DEVICE」をタップするとZIMファイルが表示されます。

こちらが「DEVICES」を押した画面です。私がダウンロードしたZIMファイルが4つあります。次に18.7GBのWikipediaをタップします。(この画面は人によります)

これがKiwixでのオフラインウィキペディアです。上の虫メガネで検索できます。

EPWINGとKiwix

ウィキペディアのオフライン化にはもう一つEPWING化したデータを使う方法があります。このEPWINGは日本生まれ日本育ちの規格で、辞書を電子機器で扱うことを目的としたものです。その歴史も30年以上あります。

EPWINGはあくまで辞書のデータ化を目的とした規格であるため、ウィキペディアの一部のグラフが大きく崩れます。

例えば、この動画はEBPocketというアプリで広島東洋カープの堂林選手を検索したものです。オフラインデータにはEPWINGが使われています。ご覧のようにグラフの各項目がズレるため非常に分かりにくくなります。(EPWINGとEBPocketの名誉のため書きますが、この動画はわざとゆっくり操作しています。実際の操作性はサクサクです)

一方こちらはKiwixで堂林選手を検索した画像です。Kiwixは基本的にWEBと同じレイアウトなため明らかに見やすいですね。

また、EPWING化したウィキペディアデータではgif画像が動きません(EPWING自体は音声ファイルも扱えるのであえて動かしていないのだと思います)。

一方Kiwixではgif画像も動きます。この動画はKiwixで「星型エンジン」を検索したものです。当然オフラインで行っています。

ただしKiwixは検索性能があまりよろしくありません。この動画はまず「ゲームオブスローンズ」で検索し、検索結果に何も現れないのを確認して次に「ゲーム・オブ・スローンズ」で検索したものです。そうです。中黒の「・」が無いと検索に引っかからないのです!!

ちなみにEPWINGとEBPocketの組み合わせだと「ゲームオブスローンズ」はもちろん「げーむおぶすろーんず」でも「game of thrones」でも更にスペースを消し「gameofthrones」でも検索に引っかかります。はっきり言って現時点(2019年12月26日)では圧倒的にEPWINGとEBPocketの方が検索しやすいです。この辺が辞書向けの規格の強みかもしれません。

まとめ

メリットデメリットは人によりますし、実際私もそれぞれの良さ悪さを他にもいくつか感じていますが大きな特徴は次の2つです。

KiwixはWEBと同じレイアウトで非常に見やすいが、検索性能があまりよくない(2019年12月26日時点)。

おわりに

今回単にKiwixの使い方だけを書く予定でしたが、このブログを書く前にKiwixについて調べたところその崇高な理念にたまげてしまい、敬意を表してKiwixについて紹介してから本文を始めました。オフラインウェブブラウザーという概念も初めて知りました。

2019年12月26日現在、日本語版ウイキペディアのZIMファイルが最大18GBな一方、英語版は78GBあります。ぜひ日本語版をダウンロードして使ってみてほしいのですが、18GBでもかなり大量に記事が入っています。日本語版も英語版も全記事がオフラインデータ化されているのではなく、過度にマイナーな記事は除外されているはずで、英語が母国語の人達はいかに情報にアクセスしやすいのか具体的に実感できます。

余談ですが、アプリ経由でのZIMファイルダウンロード画面には各ZIMファイルの特徴が書かれています。私は10.7GBのWikipedia下にある「vid」を見てウィキペディア内の動画データがまとまってるのだと思いダウンロードしたのですが、中身は18.7GBのWikipediaの画像なし版でした。多分ミス表記だと思います。

2022年1月15日追記

Kiwixのバージョン3.4.4だと記事がまともに検索出来ないバグが発生します。このバグは2021年10月10日に公開されたバージョン3.4.5で解決されています。

Android11以上であれば、Google Playからバージョン3.4.5へのアップデートが通知されます。

ところが、Android10以下では相変わらず3.4.4が最新バージョンとして表示されます。

そこで、Kiwixが公式で配布しているapkファイルをダウンロード&インストールすることで、Android10以下のデバイスでも3.4.5へのアップデートが可能となります。こちらがそのリンクとなります。

どのファイルを選べばいいか分からない場合はuniversal-release.apkを選んでください。

このapkファイルはKiwix公式ですが、一応、Google Play外からのインストールはセキュリティ上良くない行為です。なので、不安な方はGoogle Play経由でのアップデートを待つのもいいと思います(しかしその日はいつなのか…)。

以上です。

参考

About Kiwix

https://www.kiwix.org/en/about/

Kiwix – Wikipedia

https://en.wikipedia.org/wiki/Kiwix

Emmanuel Engelhart, Inventor of Kiwix: the Offline Wikipedia Browser – Wikimedia Blog

https://blog.wikimedia.org/2014/09/12/emmanuel-engelhart-inventor-of-kiwix/

ZIM (file format) – Wikipedia

https://en.wikipedia.org/wiki/ZIM_(file_format)

コメントを残す