成蹊2025/応用日本語講座
の履歴(No.3)
履歴一覧
差分
を表示
現在との差分
を表示
ソース
を表示
成蹊2025/応用日本語講座
へ行く。
1 (2025-04-10 (木) 03:59:57)
2 (2025-04-11 (金) 10:30:28)
3 (2025-04-17 (木) 11:36:03)
4 (2025-04-24 (木) 23:52:38)
5 (2025-05-01 (木) 21:16:58)
6 (2025-05-08 (木) 17:20:28)
7 (2025-05-16 (金) 09:07:36)
8 (2025-05-16 (金) 19:25:18)
9 (2025-05-23 (金) 08:38:30)
10 (2025-05-30 (金) 11:51:14)
11 (2025-05-30 (金) 11:55:45)
12 (2025-06-05 (木) 22:55:02)
13 (2025-06-06 (金) 12:20:16)
14 (2025-06-10 (火) 17:41:09)
15 (2025-06-13 (金) 10:19:47)
16 (2025-06-19 (木) 20:34:31)
成蹊2025
応用日本語講座
†
2025年度前期・金曜2限:
10:40~12:20
教室:7号館303
Mail:
ogiso@ogiso.net
シラバス
CoursePower授業ページ
↑
04/18 テキストデータと文字コード
†
↑
文字コード
†
授業資料/文字コード関連リンク
↑
テキストデータ
†
すべての基本となる文字が並ぶだけのデータ
授業資料/テキストデータとは
バイナリデータとテキストデータ
テキストデータとテキストファイル
TXT,CSV,HTM…
ファイルの種類と拡張子 参考:
拡張子辞典
拡張子(wikipedia)
授業で使うテキストデータ
授業資料/テキストデータ紹介
↑
テキストエディタ
†
テキストエディタとはどんなものか
授業資料/テキストエディタ
↑
テキストエディタのダウンロードとインストール
†
フリーソフトウェア(無償)のMicrosoft
Visual Studio Code
(VSCode)を使います。
↑
インストールと最初の設定
†
VS Codeのインストール
WindowsのスタートメニューからMicrosoft Storeを起動
VSCodeを検索
インストール をクリック
または
ブラウザで
https://code.visualstudio.com/
へ
Download for Windowsをクリック
~.exeをダブルクリックして指示に従う
最初の設定
拡張機能 Japanese Language Packの追加
参考:
https://zenn.dev/ayatokura/articles/vscode-article-2
ファイルオープン時にエンコーディングを自動判別するよう設定
参考:
https://www.javadrive.jp/vscode/setting/index3.html
↑
テキストエディタを使ってみる
†
テキストエディタの設定
行の折り返し Alt+Z
行番号表示
スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
練習用サンプルデータ(漱石 こころ.txt)
sample.zip
検索・置換、grep
検索で初出行を調べる
置換で用例数を数える
grepで用例リストを作る
タグジャンプで文脈を確認する
↑
ショートカットキー
†
Windowsの主なショートカットキー
授業資料/覚えておきたいショートカットキー
Macのショートカットキー
https://support.apple.com/ja-jp/HT201236
↑
テキストデータ(青空文庫の夏目漱石作品)の配布
†
★
soseki2.zip
(今日の授業で使います)
↑
ショートカットキー
†
授業資料/覚えておきたいショートカットキー
Mac のキーボードショートカット
https://support.apple.com/ja-jp/HT201236
↑
grepと置換でKWIC(CSVファイル)を作る(簡易版)
†
CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
KWIC:KeyWord In Context
↑
正規表現を使ってみる
†
文字クラス
例:読[まみむめもん]
半角ブラケットの中に文字を並べる→並べた文字いずれか1文字
↑
USBメモリの準備について
†
↑
参考
†
[授業資料/テキストエディタと正規表現]
↑
04/11 イントロダクション
†
自己紹介
大学共同利用機関法人人間文化研究機構 国立国語研究所
https://www.ninjal.ac.jp/
言語資源開発センター
シラバス確認
この授業の
シラバス
この授業の目的
授業の進め方
評価方法
↑
授業で利用する主なソフトウェア
†
ソフトウェアの種類・名前
利用目的
テキストエディタ
サクラエディタ
or
VisualStudio Code
テキストデータの作成・整備、正規表現を使った検索など
全文検索ソフト
ひまわり
データの検索
表計算ソフト
Excel
ピボットテーブルによる分析・グラフ作成
ワープロ
Word
文書構造を意識したレポート作成
↑
授業で利用する主なデータ
†
青空文庫
の近代の小説
国立国語研究所のコーパス
「現代日本語書き言葉均衡コーパス」
「日本語日常会話」
「昭和・平成書き言葉コーパス」
「日本語歴史コーパス」
↑
デモ
†
テキストエディタとgrep, 正規表現
全文検索システム
ひまわり
Excel(ピボットテーブル)
形態素解析:
Web茶まめ
現代語コーパス
少納言