#author("2024-11-26T14:32:10+09:00","default:ogiwiki","ogiwiki")

**青空文庫XHTMLファイルをライブラリを使って整形する [#i5eee962]

***パッケージのインストール [#td55405d]
-lxml :XMLパーザ(parser)(XMLの構造を解釈してプログラムから利用しやすいようにする)
// pip install lxml
 sudo apt install python3-lxml

-Beautiful Soup :HTMLやXMLファイルからデータを抽出・解析する
// pip install beautifulsoup4
 sudo apt install python3-bs4

//--mecabをpythonから使うモジュール
// pip install mecab


*** [#mbcb5fdc]





トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS