miku-docx2md

miku-docx2md は、Word の .docx ファイルを Markdown に変換するローカル実行ツールです。

見た目を Word どおりに再現するためのツールではありません。文章、見出し、リスト、表、リンクなどの文書構造を Markdown として読みやすく取り出すことを目的にしています。

この README は、概要と最短の使い方をまとめます。詳しい CLI option、画像 asset、debug 出力は docs/usage.md を参照してください。

できること

使い方: CLI

npm run cli -- ./sample.docx --out ./sample.md

summary も出力する例:

npm run cli -- ./sample.docx --out ./sample.md --summary --summary-out ./sample.summary.txt

画像 asset も出力する例:

npm run cli -- ./sample.docx --out ./sample.md --assets-dir ./sample.assets

debug comment も含める例:

npm run cli -- ./sample.docx --out ./sample.md --debug

進捗と処理時間の診断を stderr に出す例:

npm run cli -- ./sample.docx --out ./sample.md --verbose

CLI option の一覧、終了コード、asset 出力、manifest.json の詳細は docs/usage.mdnpm run cli -- --help にまとめています。

出力方針

miku-docx2md は、Word の見た目ではなく文書構造を優先します。

主な対応内容

Content Status
段落 対応
見出し 対応
太字、斜体、取り消し線、下線 一部対応
段落内改行 対応
外部リンク 対応
解決可能な文書内リンク 対応
箇条書き、番号付きリスト、ネスト 対応
対応
表の結合セル placeholder で簡略対応
埋め込み画像 解決可能なものを sidecar asset として出力
Word の見た目の完全再現 非対応

ビルド

npm run build

src/ts/ から Node.js runtime 用の dist/js/ を再生成します。dist/ は生成物なので Git 管理しません。CLI runtime bundle は npm run build:bundle、Web / adapter 向け runtime bundle は npm run build:runtime で生成します。

Web App

ブラウザ UI と Single-file Web App 配布物は、分離済みの miku-docx2md-web が担当します。この repository は product core、CLI、Node.js runtime bundle を担当します。

テスト

npm run test:unit

詳細ドキュメント

License

Apache License 2.0

See LICENSE.