こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

-広告-

締切り済みの質問

文章表現の良否を判定するアルゴリズム設定は可能?

人口知能の判断、「判断力」に関する疑問です。

人口知能が文章を作成するとして、

良い文章・悪い文章、
読み易い文章、読みづらい文章、
面白い文章、面白くない文章、

などを判定する文章表現の良否が判断できるアルゴリズムの
設定は可能でしょうか?

可能だとしたら、どういうパラメーターが必要になっていくのでしょうか?

例えば、amaznのレコメンドの高い小説100選などのデータを読み込ませて、
その中の文章のセンテンスの長さ、漢字とひらがな割合、前後の文脈の関連性などを
分析して、レコメンドの高い小説に近い文章などを作成することは可能なんでしょうか?

投稿日時 - 2014-10-20 17:55:43

QNo.8797148

暇なときに回答ください

このQ&Aは役に立ちましたか?

10人が「このQ&Aが役に立った」と投票しています

-広告-
-広告-

回答(6)

ANo.6

>人口(工)知能が文章を作成するとして、

良い文章・悪い文章、読み易い文章、読みづらい文章、面白い文章、面白くない文章、

などを判定する文章表現の良否が判断できるアルゴリズムの設定は可能でしょうか?

小説などについては極めて困難だと考えます。その最大の理由は「文章表現の良否」判定の統一的な基準を作ることが困難だからです。

>例えば、amaznのレコメンドの高い小説100選などのデータを読み込ませて、その中の文章のセンテンスの長さ、漢字とひらがな割合、前後の文脈の関連性などを分析して、レコメンドの高い小説に近い文章などを作成することは可能なんでしょうか?

それは可能かもしれませんが、そうした統計的な処理では平均的な「読み易い文章」はできても、それが「良い文章」「面白い文章」になるとは限らないと考えます。

一般にうねうねと長く続いて一文の長さが長大な文章は「読みづらい文章」とされていますが、例えば古典では源氏物語、近年の作品で言えば野坂昭如氏の小説などはまさにこうした文章であって、これらについては「悪い文章」とは言えず、「面白い文章」だと考える人も多いでしょう。

また「漢字とひらがな(やカタカナの)割合」にしても、扱う分野によって自ずから異なります。ブランドの名称などカタカナの比率が高いというだけの理由で「なんとなく、クリスタル」が「悪い文章」とは言えませんし、昔の中国を舞台とした歴史小説の類はどうしても漢字の割合が高くなる傾向があるでしょう。

さらに誤字・当て字についても、例えば時代による表記の違いや、漱石など現在はあまり見かけない当て字や表記を使用する作家も存在しますので、単純に一つの辞書だけを基準にはできません。

要するに小説などの文学作品は、作者がある効果を狙って、あえて平均的・教科書的な文章・文体・表記などから逸脱していることが少なくなく、しかもそれが理解されて効果を挙げているかどうかの判断は読む人ごとに異なるので、文章表現の良否の判定が一筋縄ではいかないのだと考えます。

文書の種類を限定し、例えば商品の取り扱い説明書のような極めて実用的な文章について、評価の基準を明確に決めることができれば「文章表現の良否」を判定することも可能でしょうけれど…。

投稿日時 - 2014-10-27 06:54:25

-広告-

> 人口知能が文章を作成するとして、良い文章・悪い文章、読み易い文章、読みづらい文章、
面白い文章、面白くない文章、などを判定する文章表現の良否が判断できるアルゴリズムの
設定は可能でしょうか?

文章を作成できる人工知能があるなら、その人工知能には、文章表現の修正アルゴリズムも含んでいると思われるので、その人工知能に、文章表現の修正アルゴリズムの適用度合い・レベル設定をあらかじめ設定する機能をスイッチできるものを含んでいれば、その設定はあらかじめ決められた範囲で可能なはずだと思います。 フルオートマチックで、全機能をフルに動かしかできないようになっている人工知能とか、文章表現の良否が判断の状況を出力できる機能を備えていない人工知能だと、設定したのかどうかも不明になると思います。
 
なお、良い文章・悪い文章、読み易い文章、読みづらい文章、面白い文章、面白くない文章のような評点は人工知能にとっては、文章作成の実行上では意味がないでしょうから、おそらくそうした評点はしないと思います。 もっと別の要素で文章の作成や修正をすると思います。

また、自動要約、サマリ作製、条件変更による元文章の改編改訂のような人工知能なら出来るかもしれませんが、人工知能に目的意識のようなものをインプットして、その目的を達成する文章・文書を作成させるのは、ちょっと無理のように思います。 推理小説、恋愛小説、冒険小説、政策提言書などを、目的をインプットしただけで人工知能に作製させるのは無理じゃないかなあ。 

投稿日時 - 2014-10-21 21:19:47

ANo.4

 amazonのレコメンドごときをあてにする話であれば、統計的なアプローチ。それならいくらでもやりようはあります。有名作家の文体を統計的に分析するのは、国語学では定番ですし。

 ですが、ホンキで考えるのなら簡単じゃありません。「人口知能」なんて誤字がある文章をハネるのは雑作もないと思うでしょ。ですが、わざとそう書いたのかも知れない。「凡庸な人も沢山集まると、案外良い知恵が出ることがある。人口知能だ。」文意を深く理解し、さらにダジャレまで分からないと、錯誤なのかわざとなのか判別はできません。まずは言語理解システムをきっちり作らないとね。
 ご参考:http://oshiete.goo.ne.jp/qa/24796.html

投稿日時 - 2014-10-20 21:44:06

ANo.3

そのようなことをして、文体診断をしてくれるサイトがあります。
「文体診断ロゴーン」で検索してください。

投稿日時 - 2014-10-20 18:19:13

ANo.2

高名な作家や有名人の文章と、色々な観点からの類似性を検討して、あなたは誰に近いのか、というのを出してくれるサイトがあります。

文体診断ロゴーン
http://logoon.org/

冒頭の1文をかけてみましたが、高評価で自画自賛して悦に入っております。

文章 診断 特徴 OR 傾向 - Google 検索
http://www.google.co.jp/search?q=%E6%96%87%E7%AB%A0+%E8%A8%BA%E6%96%AD+%E7%89%B9%E5%BE%B4+OR+%E5%82%BE%E5%90%91

投稿日時 - 2014-10-20 18:13:32

ANo.1

 
こんな記事を見つけました
http://www.itmedia.co.jp/news/articles/1204/04/news056.html
 

投稿日時 - 2014-10-20 17:58:50

-広告-
-広告-
-広告-
-広告-