IPA辞書:品詞分類「名詞-代名詞-縮約」について

IPA辞書の品詞分類ってどうなのかあまり聞かないのですが、解説書(PDF)を読むと新情報処理開発機構 (RWCP) の「テキストデータベース報告書 (平成8年度)」に載っているというIPA品詞体系(THiMCO97)を基に一部修正を加えたもの、なのだそうです。素晴しいことに解説書にはIPA辞書のとTHiMCO97との相違点も書かれております。だからこれを読めばIPA辞書の品詞分類は理解できるもんね!と思いまして、ちまちまと読んでみました。

で、そこで目を引いたのが品詞分類「名詞-代名詞-縮約」です。解説書(p.18)から引用します。

5.1.10 名詞-代名詞-縮約
# 代名詞と係助詞「は」の組み合わせで,短縮した形<口語>.
例: 「ありゃ」「こりゃ」「こりゃあ」「そりゃ」「そりゃあ」

とのこと。「ありゃ」→「あれは」みたいな感じね。ふーん、と思って実際にChasenで試してみると以下のようになります。

% echo "ありゃ桜だ。"|chasen
ありゃ  アリャ  ありゃ  感動詞
桜      サクラ  桜      名詞-一般
だ      ダ      だ      助動詞  特殊・ダ        基本形
。      。      。      記号-句点
EOS

% echo "こりゃ桜だ。"|chasen
こりゃ  コリャ  こりゃ  感動詞
桜      サクラ  桜      名詞-一般
だ      ダ      だ      助動詞  特殊・ダ        基本形
。      。      。      記号-句点
EOS

% echo "こりゃあ桜だ。"|chasen
こりゃ  コリャ  こりゃ  感動詞
あ      ア      あ      フィラー
桜      サクラ  桜      名詞-一般
だ      ダ      だ      助動詞  特殊・ダ        基本形
。      。      。      記号-句点
EOS

% echo "そりゃ桜だ。"|chasen
そりゃ  ソリャ  そりゃ  接続詞
桜      サクラ  桜      名詞-一般
だ      ダ      だ      助動詞  特殊・ダ        基本形
。      。      。      記号-句点
EOS

% echo "そりゃあ桜だ。"|chasen
そりゃ  ソリャ  そりゃ  接続詞
あ      ア      あ      フィラー
桜      サクラ  桜      名詞-一般
だ      ダ      だ      助動詞  特殊・ダ        基本形
。      。      。      記号-句点
EOS

というわけで、一個も品詞分類「名詞-代名詞-縮約」と判断しません。まぁChasenもさすがにこんなのまともに学習させてないのかな、と思いましたが、それにしても「こりゃあ」「そりゃあ」が接続詞+フィラーってのも変だなと気付きました。

そこで調べてみた結果、こうなるのも当然のはずで、そもそもIPA辞書(2.7.0)の中で品詞分類「名詞-代名詞-縮約」となっているのは次のものだけだったのでした。

(品詞 (名詞 代名詞 縮約)) ((見出し語 (私しゃ 621)) (読み ワタシャ) (発音 ワタシャ) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (あたしゃ 621)) (読み アタシャ) (発音 アタシャ) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (わたしゃ 270)) (読み ワタシャ) (発音 ワタシャ) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (そりゃあ 270)) (読み ソリャア) (発音 ソリャー) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (私ゃ 621)) (読み ワタシャ) (発音 ワタシャ) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (そりゃ 621)) (読み ソリャ) (発音 ソリャ) )
(品詞 (名詞 代名詞 縮約)) ((見出し語 (そりゃァ 621)) (読み ソリャァ) (発音 ソリャー) )

「そりゃ」はあるけど、「ありゃ」「こりゃ」「こりゃあ」「そりゃあ」がないぞ、五つ中四つも分類から外れてたら例になってないじゃん!ていうか「そりゃァ」って、なんで「ァ」なの!!というわけで、これでは如何に学習しようとダメなわけですね。

ちなみにMeCabはなんだか良く分かっていないのですが仮定縮約1,2なるものがあって(これって自動生成?)、形容詞に関しては次のようなものを辞書として持っているようです。

やぼったけりゃ,15,15,6956,形容詞,自立,*,*,形容詞・アウオ段,仮定縮約1,やぼったい
,ヤボッタケリャ,ヤボッタケリャ
やぼったきゃ,17,17,6956,形容詞,自立,*,*,形容詞・アウオ段,仮定縮約2,やぼったい,
ヤボッタキャ,ヤボッタキャ
くさけりゃ,61,61,6673,形容詞,接尾,*,*,形容詞・アウオ段,仮定縮約1,くさい,クサケ
リャ,クサケリャ
くさきゃ,64,64,6673,形容詞,接尾,*,*,形容詞・アウオ段,仮定縮約2,くさい,クサキャ,クサキャ

でも代名詞についてはこうした仮定縮約が存在しないようです(追記:これは当然で「仮定縮約」とは動詞・形容詞と仮定「ば」との縮約を指すものだから!とってもとっても勘違いしました、ごめんなさい)。「私ぁ」があるのなら「彼女ぁ」とかダメかなぁ、と思ったのですが、ダメですよね確かに。仮定縮約は他にも動詞、助動詞などにも存在するようで、この辺苦労したんだろうなぁ、とか想像できてしみじみします。

という感じで、IPA辞書って、細かく見ていったら色々と変なところがあるのではないでしょうか。