#author("2023-05-16T09:38:54+09:00","default:ryutarodayo1234","ryutarodayo1234")
#author("2023-05-17T15:04:09+09:00","default:ryutarodayo1234","ryutarodayo1234")
*AI導入
RIGHT:欠席回数 2

#contents


~
~
**第5回
RIGHT:2023.05.17
~

機械学習においては、特徴量を選択する必要がある。特徴量とは、目的を説明するための情報であり、この情報が良くないと正しく動作するAIを作成できない。特徴量を選択するために統計学やデータサイエンスを用いる方法があるが、データに合わせてその手法を変えていく必要がある。そのために、まずデータ自体を整理し、データを理解する必要がある。整理を行うための手法のひとつが可視化である。可視化を行うと、経験によって直感による理解を最大限に利用することができる。例えば、値の大小は、バーの高さ低さとして表すことができる。また、同じ属性は同じ''形''として表すとよい。
~

データを可視化するときにグラフを使うことが多い。2つの項目の関係を確認するときは''折れ線グラフ''を用いる。
~

また、偏りなど分布を確認するときは''ヒストグラム''を用いる。
~

データの可視化は、データそのものを理解する場面やなんらかの主張を第三者に納得させる場合に役に立つ。AIでデータの可視化が必要な場合は''データそのものを理解する''ときである。データの可視化は様々な場面で効力を発揮することができる技術であり、社会で生きていく上で必須技術であろう。
~

目視で確認した後、統計などを取り、データがどの様な性質があるのかを数値情報として確認する。外れ値の削除などは、グラフや数値を目で見て取り除くではなく、統計処理によって行うことが重要である。主観的な判断はデータの''偏り''を生み、また、誰からも納得を得られないからである。
~

データの代表値として、平均値、中央値、最頻値、最大値、最小値などがある。全データを合計しデータ数で割った値を''平均値''と呼ぶ。
また、最もよく出現する値を''最頻値''と呼び、
データを昇順に並び替えたときの真ん中の値を''中央値''と呼ぶ。
~

次のヒストグラムに対応する箱ひげ図として最も適切なものはA,B,Cのうち''B''である。
#ref(histgram2.jpg)

~
~
***箱ひげ図
分位数・パーセンタイル・percentile

-データを小さい順に並べたとき、初めから数えて全体の𝜶%番目に位置する値を𝜶パーセンタイルと言う.
-例:25人の試験結果のデータについて
-50パーセンタイルは最低点から13番目の人の点数(中央値) • 0パーセンタイルは最低点から1番目の人の点数(最低点)
-100パーセンタイルは最低点から25番目の人の点数(最高点) 
-25%ごとに分けて「四分位数(しぶんいすう)」で表すことがある. • 第1四分位数:25パーセンタイル
-第2四分位数:50パーセンタイル
-第3四分位数:75パーセンタイル 

***可視化により、データを理解しやすくなる
-適切な手法で、可視化すること
***特に、AIでは下記が重要
-仮説生成やモデル選択の前段階での 「データそのものを理解する」場面
-視覚的にデータのいろいろな面を表示することで、「データに語らせる」




~
~
**第4回
RIGHT:2023.05.10
欠席

|10進数|2進数|16進数|
|0|0|0|
|1|1|1|
|2|10|2|
|3|11|3|
|4|100|4|
|5|101|5|
|6|110|6|
|7|111|7|
|8|1000|8|
|9|1001|9|
|10|1010|A|
|11|1011|B|
|12|1100|C|
|13|1101|D|
|14|1110|E|
|15|1111|F|
|16|10000|10|
|17|10001|11|
|18|10010|12|
|19|10011|13|



~
~
**第3回
RIGHT:2023.04.26
欠席


~
~
**第2回
RIGHT:2023.04.19

-AI研究の始まりの論文は''Shannon''のコンピュータにチェスをさせるための論文であると言われている。
-その後にダートマス会議の申請に''AI''が使われ、一般に認知され盛んに研究がなされた。
-第1次ブームで行われた主な研究は''探索と推論''に関する研究であった。
-また、第1次ブームでは、人間の脳細胞を計算モデル化した''パーセプトロン''が発明された。第1次ブームでは、研究のための問題を作り、解決していたことから、AIは本当に役に立つのかとの批判も受けた。
-第3次ブームでは、第2次ブームの問題であったコンピュータの知識の獲得について進展があった。その技術の筆頭が''ディープラーニング''である。また、AI研究が発展しやすい環境が出来ていたのも要因である。
-第3次ブームでは、主に''機械学習''に関する研究がなされており、未だ限界がまだ見えず、様々な分野で実用的なAIが開発されている。

~
~

**第1回
RIGHT:2023.04.12

***AIとは何か。
端的に表すと、人工的に作られた知能である。
ここでいう知能とは、あたまのはたらき、知識の蓄積や物事を判断する能力であり、知能検査で測られ、知能年齢または知能指数で表わされる精神水準である。
究極的な目的は、「知能を持った機械を作ること」 であり、学術的な人工知能の正確な定義は時代によって変わるため、説明できない。
社会的には、知能の有無に関わらず、コンピュータに人間の知的機能を代行させるソフトウェアを表すことが多い。

~

***参考図書
-教養としてのデータサイエンス (データサイエンス入門シリーズ) 
-人工知能の基礎