IPA辞書における仮定縮約について

こういう話を「言語学」に分類するのはとってもとっても微妙な気がしますが、IPA辞書における仮定縮約とChaSenMeCabにおけるその扱いの相違についてまとめておきたいと思います。というか前回のがとっても中途半端だったり間違っていたりしたので反省してちゃんと書きたいと思います。

まず、「IPA辞書:品詞分類「名詞-代名詞-縮約」について」で触れたように、IPA辞書における「名詞-代名詞-縮約」とは次のように定義されています。

5.1.10 名詞-代名詞-縮約
# 代名詞と係助詞「は」の組み合わせで,短縮した形<口語>.
例: 「ありゃ」「こりゃ」「こりゃあ」「そりゃ」「そりゃあ」

つまり、「こりゃ」=「これ」+「は」のように見做すものが縮約です。IPA辞書の体系内では「そりゃ」は品詞分類「名詞-代名詞-縮約」にカテゴリされています。また前回触れたように「こりゃ」など例に挙げられたものが全てIPA辞書に含められているわけではありません。

さて次に本題の仮定縮約です。仮定縮約には1,2が存在しており、例えば次のようなものが相当します。

  • 歩み寄りゃ(動詞「歩み寄る」に対する仮定縮約1)
  • やぼったけりゃ(形容詞「やぼったい」に対する仮定縮約1)
  • やぼったきゃ(同上仮定縮約2)

仮定縮約は活用の一種であり、動詞・形容詞についてそれぞれ定義されています。まずIPA辞書の解説書「ipadic version 2.7.0 ユーザーズマニュアル」における「5.3 動詞」から活用形「仮定縮約1」(p.24)を引用します。

仮定縮約1 # 仮定バ接続と「バ」とが合わさって短縮した形<口語>.
例: 「分かれりゃ」

つまり動詞における活用形「仮定縮約1」とは、「歩み寄りゃ」=「歩み寄る」+「ば」というものであり、「歩み寄れば」の口語形の一種であると判断されています。

次に同様に解説書における「5.4形容詞」から活用形「仮定縮約1」「仮定縮約2」(p.30)を引用します。

仮定縮約1
# 仮定バ接続と「バ」とが合わさって短縮した形1<口語>.
例: 「欲しけりゃ」「(それが)なけりゃ(困る)」
仮定縮約2
# 仮定バ接続と「バ」とが合わさって短縮した形2<口語>.
例: 「(それが)なきゃ(困る)」

よって形容詞における活用形「仮定縮約1」とは、「やぼったけりゃ」=「やぼったい」+「ば」というものであり、「やぼったい」の口語形の一種であると判断されています。同様に「仮定縮約2」は「やぼったきゃ」=「やぼったい」+「ば」というものです。

これを見る限り仮定縮約1は語幹+「りゃ」(動詞)もしくは「けりゃ」(形容詞)などであり、仮定縮約2は語幹+「きゃ」となっているようです。ただし動詞においては仮定縮約1は語幹+「ya」の形式ということでしょうか。

% echo "基づきゃ"|chasen
基づきゃ モトヅキャ 基づく 動詞-自立 五段・カ行イ音便 仮定縮約1
EOS

よって形容詞とは違い動詞には仮定縮約1,2の区別がなく、また形容詞における「仮定縮約1」と動詞における「仮定縮約1」は名前は同じでも多少異なる意義付けが与えられていると言えます。

ChaSenにおける仮定縮約

以上に通りにChaSenにおける仮定縮約は活用の一種として扱われています。活用を定めている cforms.cha を参照すると、以下のものについて仮定縮約の活用が認められています。

  • 仮定縮約1及び仮定縮約2の活用を行なうもの:形容詞・アウオ段, 形容詞・イ段, 特殊・ナイ, 特殊・タイ
  • 仮定縮約1の活用のみを行なうもの:カ変・クル, カ変・来ル, サ変・スル, サ変・−スル, サ変・−ズル, 一段, 五段・カ行イ音便, 五段・カ行促音便, 五段・カ行促音便ユク, 五段・ガ行, 五段・サ行, 五段・タ行, 五段・ナ行, 五段・バ行, 五段・マ行, 五段・ラ行, 五段・ラ行アル, 五段・ラ行特殊, 一段・クレル, 一段・ル
  • 仮定縮約2の活用のみを行なうもの:なし
  • 仮定縮約1及び仮定縮約2の活用を行なわないもの:一段・病メル, 五段・ワ行ウ音便, 五段・ワ行促音便, 四段・カ行, 四段・ガ行, 四段・サ行, 四段・タ行, 四段・バ行, 四段・マ行, 四段・ラ行, 四段・ハ行, ラ変, 上二・ダ行, 上二・ハ行, 下二・ア行, 下二・カ行, 下二・ガ行, 下二・サ行, 下二・ザ行, 下二・タ行, 下二・ダ行, 下二・ナ行, 下二・ハ行, 下二・バ行, 下二・マ行, 下二・ヤ行, 下二・ラ行, 下二・ワ行, 下二・得, 特殊・タ, 特殊・ダ, 特殊・デス, 特殊・ジャ, 特殊・マス, 特殊・ヌ, 文語・ベシ, 文語・ゴトシ, 文語・ナリ, 文語・マジ, 文語・シム, 文語・キ, 文語・ケリ, 文語・リ, 文語・ル, 不変化型, 形容詞・イイ, 特殊・ドス, 一段・得ル, 特殊・ヤ

この結果から、仮定縮約1,2の両方の活用を行なうものはほとんどの形容詞と助動詞「ない」「たい」であることが分かります。

  • 赤けりゃ(形容詞・アウオ段)
  • 赤きゃ(形容詞・アウオ段)
  • 働かなけりゃ(ナイ)
  • 働かなきゃ(ナイ)
  • 食べたけりゃ(タイ)
  • 食べたきゃ(タイ)

次に仮定縮約1のみ活用するものはほとんどの五段活用動詞とその他サ変動詞や多くの一段活用動詞などです。

  • 基づきゃ(五段・カ行イ音便)
  • 運動すりゃ(サ変・スル)
  • 比べりゃ(一段)

ただし「狙われる」のようなものにはやや注意が必要です。

(品詞 (動詞 自立)) ((見出し語 (狙われる 3331)) (読み ネラワレル) (発音 ネラワレル) (活用型 一段) )

以上のように辞書には一段活用の動詞として存在しますが、実際には「狙われりゃ」は「狙われる」の仮定縮約1活用よりも「狙う」+「れる」の仮定縮約1活用として分析される方が優先されます。

% echo "狙われりゃ"|chasen
狙わ ネラワ 狙う 動詞-自立 五段・ワ行促音便 未然形
れりゃ レリャ れる 動詞-接尾 一段 仮定縮約1
EOS

次に、仮定縮約2のみを行なうものはありません。つまり仮定縮約1の活用を行なう形容詞は常に仮定縮約2の活用を行なうということのようです。また既に書いたように動詞の場合は仮定縮約は1のみですから、動詞がここに分類さえれる可能性はないため、このような結果になったのだろうと思います。

最後に仮定縮約1,2のどちらの活用も行なわないものは様々です。四段・下二段・上二段活用動詞はどれも仮定縮約活用を行ないませんが、これは文語も文語なので当然のことだと思われます。仮定縮約の説明文には「口語」と断わっていますから、そりゃ文語とくっついてたらまずいですもんね。同様にして「文語」の助動詞系列も同様です。不変化型はまぁ活用そのものをしないものだと思いますから、これも同様に仮定縮約を行ないません。「特殊」になっている諸々についてはまぁ無理っぽい感じのものが並んでいるのでそういうことだと思います。

なお、「一段・病メル」は仮定縮約をとらないようなので「病めりゃ」を試してみたのですが、これは実は大丈夫なんですよね。というのも動詞「病める」は普通の一段動詞に分類されているからです。そもそもIPA辞書中に「一段・病メル」に分類されているものってないんですよね。これは一体なんなのでしょう?ひょっとして、歴史的経緯でたまたま cforms.cha に不要なものが残ってしまった、とかなのかな。同様に「形容詞・イイ」も不明です。一応こちらの方は解説書(p.31)に説明はあるのですが、辞書には見つかりません。

5.4.3 形容詞-自立形容詞・イイ【活用形】
例: 「いい」「ええ」…

5.4.7 形容詞-非自立形容詞・イイ【活用形】
例: 「いい」

また「一段・得ル」は「…しうる」とかの「うる」などですが、単なる一段活用の「得る」(発音は「エル」)も辞書に存在するので実質的には仮定縮約活用を行なっているようなものです。

というわけで、以上をまとめますと、ChaSenにおいては現代語を想定すればほとんどの動詞・形容詞は仮定縮約活用を行うと考えて良いようです。

MeCabにおける仮定縮約

一方、MeCabでは高速化のために活用は全て展開されて辞書項目となっています。よって仮定縮約活用形も辞書項目として存在しているわけです。

毒々しけりゃ,41,41,4682,形容詞,自立,*,*,形容詞・イ段,仮定縮約1,毒々しい,ドクドクシケリャ,ドクドクシケリャ
毒々しきゃ,42,42,4682,形容詞,自立,*,*,形容詞・イ段,仮定縮約2,毒々しい,ドクドクシキャ,ドクドクシキャ

踏んばりゃ,770,770,7150,動詞,自立,*,*,五段・ラ行,仮定縮約1,踏んばる,フンバリャ,フンバリャ

よく分かっていないのですが、こうした項目はChaSenと同等の活用によって自動生成されているのだろうと思います。ただしChaSenの場合は活用形毎に仮定縮約の有無を定めていましたから、各語について仮定縮約を認めるとか認めないとかいう選択肢はありません。しかしMeCabでは辞書項目から削除すれば余計な仮定縮約活用形を削除できますので、ChaSenに比べれば細かい制御が可能であろうと思われます。

じゃあ無理矢理に例として。

くりゃりゃ,770,770,9279,動詞,自立,*,*,五段・ラ行,仮定縮約1,くりゃる,クリャリャ,クリャリャ

という項目があります。さすがに「くりゃりゃ」なんて言うヤツいないだろ!と思ったら削除できます。ていうか「くりゃる」ってなによ?gooの大辞林だと「動ラ四」ってなってるけど。

とは言え、別に余計な仮定縮約を削ったからといって何か利点があるかと言えばそうでもないので、気休めです。

まとめ

長い!ので短くまとめますと、仮定縮約とは動詞・形容詞+仮定「ば」の縮約であり、IPA辞書においては活用の一種として扱われています。また口語を想定しているので文語的な語に対する活用は認められません。

ついでに今回これを書くにあたってIPA辞書をまじまじと眺めてみましたが、やっぱりちょっと変な項目があると思います。さっき挙げた「くりゃる」は本当に五段・ラ行でいいのでしょうか。あと例えば「装束く」も「五段・カ行イ音便」で良いのでしょうか。また仮に良かったとしてこうした古めかしい言葉が本当に仮定縮約のような活用を受けるものでしょうか。IPA辞書を形態素解析専用の辞書と考えれば実用上全く問題がないので良いと思うのですが、日本語の辞書としてはやや疑問点が残るかと思われます。

結局のところIPA辞書の性質というものがユーザマニュアルではいまいち不明瞭なのですが、もっと詳しい解説がどこかにあったりするのでしょうか。もう少し調べてみたいと思います。

追記

そういえばIPA辞書付属の cforms.cha から仮定縮約を抜き出すために二年ぶりくらいにgaucheスクリプト書きました。正直右も左も分からなくなっていて完全初心者に戻っていましたが、せっかくだから書いたスクリプトを一応公開しておきます。

(use gauche.collection)

(define (仮定縮約1? . (cform))
  (boolean
   (find (lambda (ending) (equal? (car ending) '仮定縮約1)) (cadr cform))))

(define (仮定縮約2? . (cform))
  (boolean
   (find (lambda (ending) (equal? (car ending) '仮定縮約2)) (cadr cform))))

(define cforms (port->sexp-list (open-input-file "cforms.cha")))

(define 仮定縮約1&2
  (filter
   (lambda (cform)(and (仮定縮約1? cform) (仮定縮約2? cform)))
   cforms))

(define 仮定縮約1のみ
  (filter
   (lambda (cform) (and (仮定縮約1? cform) (not (仮定縮約2? cform))))
   cforms))

(define 仮定縮約2のみ
  (filter
   (lambda (cform) (and (not (仮定縮約1? cform)) (仮定縮約2? cform)))
   cforms))

(define 仮定縮約なし
  (filter
   (lambda (cform) (not (or (仮定縮約1? cform) (仮定縮約2? cform))))
   cforms))

(define (pp . (cforms))
  (let ((cats (map (lambda (cform) (symbol->string (car cform))) cforms)))
    (print (string-join cats ", "))))

(pp 仮定縮約1&2)
(pp 仮定縮約1のみ)
(pp 仮定縮約2のみ)
(pp 仮定縮約なし)

久々だから難しい書き方はしないで極めて愚直に書いております。文系でごめんなさい。