AI の履歴差分(No.7) - りゅうこのおへや

履歴一覧
ソースを表示
履歴を表示
AI は削除されています。
- 1 (2023-05-31 (水) 14:51:12)
- 2 (2023-05-31 (水) 14:51:20)
- 3 (2023-06-04 (日) 10:08:57)
- 4 (2023-06-07 (水) 09:00:01)
- 5 (2023-06-07 (水) 15:07:33)
- 6 (2023-06-14 (水) 12:36:27)
- 7 (2023-06-21 (水) 12:57:26)
- 8 (2023-07-12 (水) 13:33:01)
- 9 (2024-05-16 (木) 19:33:54)
追加された行はこの色です。
削除された行はこの色です。
#author("2023-06-14T12:36:27+09:00","default:ryutarodayo1234","ryutarodayo1234")
#author("2023-06-21T12:57:26+09:00","default:ryutarodayo1234","ryutarodayo1234")
*AI
RIGHT:AIについて学んだこと

~

**目次
#contents
~
~

**AIとは何か。
端的に表すと、人工的に作られた知能である。
ここでいう知能とは、あたまのはたらき、知識の蓄積や物事を判断する能力であり、知能検査で測られ、知能年齢または知能指数で表わされる精神水準である。
究極的な目的は、「知能を持った機械を作ること」 であり、学術的な人工知能の正確な定義は時代によって変わるため、説明できない((社会的には、知能の有無に関わらず、コンピュータに人間の知的機能を代行させるソフトウェアを表すことが多い。))。

~
**AIの歴史
AIの研究は、その始まりから幾つかの「ブーム」と「冬期」を経験してきました。それぞれの時代には、特定の課題や技術が主要な焦点となり、その時代の研究成果が後の発展に影響を与えてきました。

AIの研究の始まりは、クロード・シャノンのコンピュータにチェスをさせるための論文に遡ることができます。1950年代のダートマス会議では、"人工知能"という語が初めて使われ、広く認知され始めました。

第1次AIブームでは、探索と推論が主な研究の焦点であり、パーセプトロンのような人間の脳細胞を模倣した計算モデルが登場しました。しかし、AIが本当に役立つのかという批判もありました。これは、当時のAI研究が問題を自己作成し、その解決に注力していたためです。

第3次AIブームでは、先のブームでの問題点であったコンピュータの知識の獲得についての進展がありました。ディープラーニングという技術がその筆頭として挙げられます。この時期には、AI研究が発展しやすい環境が整ってきました。データ収集や計算能力の向上、インターネットの普及などがそれを可能にしました。

現在は、機械学習を中心とした研究が活発化しています。AIの限界がまだ見えず、医療から自動運転車、言語翻訳まで、様々な分野で実用的なAIが開発され、実用化されています。これからのAI研究は、さらに広範で深い影響を及ぼすことが期待されています。

~
**データの可視化
特徴量の選択は機械学習の鍵となるステップの一つです。特徴量は、予測モデルが目的変数を予測するために使用する情報で、適切な特徴量が選択されなければ、予測モデルの性能は著しく低下します。

データ可視化が提供する情報は、データ分析やAIモデル設計の初期段階で非常に価値があります。その後、さらに詳細な分析のために統計的手法を用いることができます。データの代表値や分散、偏りなどの情報は、特徴量選択の方向性を示す貴重な洞察を提供します。
また、四分位数やパーセンタイルといった統計的手法と組み合わせることで更に有用となります。箱ひげ図はその一例です。

データの理解と分析は、AIや機械学習モデルの設計と性能改善において重要なステップです。それらは、観察、統計分析、データ可視化といった手法を用いて進められます。これら全てのステップが互いに補完し合い、より良いAIモデル設計のために役立つことが期待されます。

***参考
-データサイエンス

~
**データの標準化
機械学習では、特徴量のスケールの違いがモデルの性能に影響を及ぼすことがあります。そのため、正規化や標準化といった前処理がよく行われます。これらの手法は、特徴量の範囲を一定の範囲に制限することで、特徴量間のスケールの違いを調整します。

***参考
-データサイエンス
~
**AIデータ倫理

AIを誰でも簡単に利用することが可能となり、さまざまな技術が大衆的になった。AIは強力な道具で社会が豊かになる反面、悪用されると社会に大きなダメージを与える可能性がある。

***技術例
-[[ディープフェイク>https://www.google.com/search?q=ディープフェイク]]

~

**ELSI

エルシーとは、Ethical, Legal and Social Issuesの頭文字をとったもので、''倫理的問題(Ethical)''と''法的問題(Legal)''、''社会的問題(Social)''の3つから成り立っている。


~

***倫理的問題(Ethical)
-その科学(技術)研究がどのような倫理的問題をはらむか
-そもそも各科学領域における「倫理」とはなにか
-既存の倫理学の体系に収まるのか

~

***法的問題(Legal)
-その科学、技術はどの法の枠組で捉えられるか
-現行法で不十分な場合、どのような指針、法の形成が必要か。関連してどのような行政規制が必要か

~

***社会的問題(Social)
-その科学(技術)は社会に受容されるか • どのような形であれば受容されるのか
-メリットとデメリットのトレードオフ。''社会の受容ライン''はどこか

~


**AI利用における気を付けること

~

***データの健全性

-捏造
 存在しないデータを作り出すこと

-剽窃、盗用
 データを不正に使い回すこと

~

***データ取り扱いの健全性
''バイアス、偏り''

-関連付けバイアス
--ステレオタイプに基づくラベル付けによるバイアス

-確証バイアス
--仮説を検証する時にそれを支持する情報ばかりを集め、 反証する情報を無視または集めようとしないために生じるバイアス

-自動化バイアス
--自動化されたシステムの結果を信じやすく、矛盾する他の結果は無視しがち

-社会的バイアス
--社会的な偏見などによって生じた格差によって、生じるバイアス 例:住んでいる地域を分析データに含めることで、意図せず分析結果が人種の違いを反映


~


**情報セキュリティ的なデータの保護

-個人情報とプライバシーの問題
--名前や生年月日、住所などその人が誰なのか特定できる情報
--個人ID、マイナンバー

-その他の個人の情報
--データ、購買履歴、Webの閲覧履歴、IPなども

~

**個人情報・データの保護
***情報を保ちながら個人情報を匿名化する様々な手法

***個人のレベルでも気を付けること

-[[インターネットリテラシー>https://www.google.com/search?q=インターネットリテラシー]]
-[[情報リテラシー>https://www.google.com/search?q=情報リテラシー]]

~

**AI倫理

***思考実験 : トロッコ問題

ブレーキの壊れた自動運転のトロッコが暴走している。線路の先には5人が横になっている。分岐操作レバーがあり、操作をすれ ば1人を犠牲に5人を助けることができる。あなたはどう行動すべきか?
AIは、不測の事態が起きても何かの判断を下す。AIは倫理的に判断できるのか?その責任は?

~

**AIに利用するデータの著作権
***AIとデータと著作権

-AIに与えるデータをwebから収集しても良いか

 日本の法律では、AIが生成した情報の著作権は現状では存在しないとされています。
 現状では良い

-日本の著作権は''人が作成したか''が焦点

 私の意見ですが
 
 ・プログラムAIモデル→開発者に著作権がある
 ・AIの出力物→著作権がない
 ・AIの出力物→著作権が発生する場合がある
 
 と思います。今後変わる可能性あり。

~

**責任のあり方
***アカウンタビリティ Accountability

-事故が起きたとき、その理由を説明する責任と、 誰がどの程度の金銭的な補償責任を負うのか法的対策
-責任者は誰か : 開発者、販売者、購入者、利用者など

現在のAIは、ブラックボックスとなっていることが多く、 アカウンタビリティを果たすことが、現状では難しい。

~
**機械学習の種類

***教師あり学習 | 線形回帰分析
-正解データ(教師データ)を作成者が与える
-画像判定や時系列予測、株価の推測に有効
-時系列予測とは過去の事例と照らし合わせ、未来を予想する。
-回帰((入力をもとに何かの値を説明、明日の株価予測など))や分類((入力が何かを判定。画像が猫、犬、人間かどうかなど))が該当する
-画像の高精細化、セグメンテーションなどに使われる
-目的変数と説明変数の関係を定量的に分析し、分析結果に基づく予測

~

***教師なし学習 | クラスタリング clustering
-正解データ(教師データ)を与えない学習
-入力対しての正解は与えず、機械自身が正解を導き出す
-クラスタリング（グループ分け）、次元圧縮、テキストマイニング
-各標本を似たもの同士のクラスターに分類する手法

~

***強化学習(環境から学習)
-環境データを与え、その環境における行動を決定。
-行動に対する報酬や負の報酬（罰）を与え、その報酬が最大となるように学習
-将棋、囲碁、ロボット歩行（ルンバのようなもの）など


~
~