ブログ記事64件
今回はプログラミング言語の「Python」を使って作成しました。Q学習のプログラムです。学習が進むとねずみが敵を避けゴールに向かうようになります。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考書「Pythonでつくるゲームプログラミング入門」■ゲーム用ライブラリ「pyglet」■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【Q学習】強化学習を初学者向け
今回はプログラミング言語の「Python」を使って作成しました。Q学習が視覚化できるようにプログラムを作成しました。学習が進むとねずみが敵を避けゴールに向かうようになります。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考書「Pythonでつくるゲームプログラミング入門」■ゲーム用ライブラリ「pyglet」■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【
今回はプログラミング言語の「Python」を使って作成しました。Q学習をやってみました。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【Q学習】強化学習を初学者向けにわかりやすく解説!Pythonで実装」
今回はプログラミング言語の「Python」を使って作成しました。ディープニューラルネットワーク(DNN)のライブラリを自作し、ランダムマップ100個用意してキャラクターにアイテムを拾わせる方法です。■参考書「Pythonで学ぶAI・数学・アルゴリズム」■参考サイト「【入門】ニューラルネットワークとは【40単語以上を網羅的にまとめました】」
今回はプログラミング言語の「Python」を使って作成しました。ディープニューラルネットワーク(DNN)のライブラリを作成し、XOR回路を実現しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」■参考サイト「【入門】ニューラルネットワークとは【40単語以上を網羅的にまとめました】」
今回はプログラミング言語の「Python」を使って作成しました。下図のような5つの入力を持つ多層パーセプトロンを自作しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」
今回はプログラミング言語の「Python」を使って作成しました。XOR回路をニューラルネットワーク(多層パーセプトロン)で作成しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」
今回はプログラミング言語の「Python」を使って作成しました。ニューラルネットQ学習でコンピュータに100000ステップ、学習させてみました。80~90%くらいの確率で青色のクリスタルを拾うようになりました。■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。Q学習でコンピュータに10000ステップ学習させてみました。ほぼ100%の確率で青色のクリスタルを拾うようになりました。■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。入力層に120個のデータ、中間層に128個のユニット、出力層に1個のユニットを持つニューラルネットワークです。■Pythonの実行環境Python:3.9.4TensorFlow:2.11.0NumPy:1.26.4Matplotlib:3.8.3■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。入力層に30個のデータ、中間層に32個のユニット、出力層に1個のユニットを持つニューラルネットワークです。■Pythonの実行環境Python:3.9.4TensorFlow:2.11.0NumPy:1.26.4Matplotlib:3.8.3■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。2層の3つのニューロンモデルから構成されるシンプルなニューラルネットワークです。■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。シグモイド関数です。■参考書「「強化学習」を学びたい人が最初に読む本」
今回はプログラミング言語の「Python」を使って作成しました。線形回帰モデルです。平均二乗誤差(MSE)を計算して、勾配法で重みを求めています。■参考書「「強化学習」を学びたい人が最初に読む本」
皇居三の丸尚蔵館という美術館が一昨日の文化の日にオープンって事で行ってきました。もともと施設としてはあったのですが、展示空間を大きくしてのリニューアルオープンだそうです。入館は時間指定の事前予約制です。一昨日予約をしたのですが、今日の午前中に予約を取ることができました。久々の東京。毎週一度は事務所のある天王洲アイルへ行くため品川までは行ってますがその先は行かない。前の会社では有楽町の事務所にも通勤はしていたし、しょっちゅう東京から新幹線乗っていたのでコロナ前までは普通に行っていた東京
本日は、自技会主催の秋季大会を聴講してまいりました。もちろんセッションは二輪車の運動・制御・安全Iです👍まずは、近畿大学の酒井先生のウイーブ・ウォブル対策の鍵はキャスタ角ウイーブ・ウォブル(自励振動)の開発においてパラメータスタディに時間を要するとの声を聞く.そこでその戦略を本論文は考察する.まず「全」設計変数における自励振動発生領域を図示し,次にその影響から設計変数を分類した.その結果キャスタ角の影響を大域的に把握しながら設計するべきとの結論を得た.と言うものです。簡潔に一言で言
強化学習に関する本はいろいろ出ていますが、状態価値関数やら行動価値関数やら方策やらベルマン方程式やらややこしい話が満載で、結局何をどうすればよいのかよくわからなくなります。この本はタイトルに「実践」とあるように、理論よりもプログラムを動かして体で理解することを目指しているのがわかりやすくてよいところ。プログラムも著者と関係者が少しずつ拡張してきたものらしいので、かなりわかりやすいと思います。ただ転移学習については自分があまりやりたいと思う状況がなく斜め読みしたのでちゃんと読
今日も暑い今日は一応仕事は休み。水曜はトリミングでした。ペンダントがアイスクリームでなんか涼しげ。耳の毛はかなり長め。たしか再来週の日曜が土用だったか、やはりこの季節に一度はうなぎでもと思って竹葉亭を予約しようと思ったら、8月末まで繁忙期なので予約できないということ。それでは、と思い、そごうへ早めに行き一番狙いで10時半頃一度店を見に行ったらさすがに誰も並んでなんかいない。でもわからないので開店10分前の10時50分頃に行ったら本当に一番でした。そ
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、前々回の『強化学習』で書き漏れていた内容を書いていきます。強化学習の手法として、モデルフリー方策ベースモデルフリー価値ベースモデルベース(モデルベース方策ベースモデルベース価値ベース)があります。モデルフリー方策ベースは、ある状態に対してある行動を起こす確率をパラメトリックな関数で表現し、この関数を用いて一連の行動による報酬の期待値を求め、期待値が大きくなるように関数のパラメー
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、『深層強化学習』について書いていきます。深層強化学習は、ディープラーニングと強化学習を組み合わせた手法です。エージェント(学習モデル)が環境との相互作用を通じて学習し、最適な行動をとるための方策を獲得することを目指します。深層強化学習とすることで、強化学習よりも状態や行動の組み合わせが多い場合の学習が可能になりました。これにより、縮約表現の必要性が緩和されました。縮約表現とは、状態の重要
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、『強化学習』について書いていきます。強化学習は、機械学習の一部で、与えられたデータをもとに試行錯誤して学習し、データの価値を最大化する方法です。強化学習では、環境と学習目的を設定します。環境は状態、行動、報酬、遷移確率などを内包します。行動主体であるエージェントが環境内で学習目的を達成するように、状態に対する最適な行動選択の学習を行います。また、行動選択の結果、エージェントは報酬を得ます。学習目
先日、二日間の公認講座を受講してきました公認講座も5年目なんですかねえ(PT何年目とかもよくわかっていない、時間の流れが早くて(笑))この二日間は動きまくった二日間でした自分の弱さを痛感させられました人間には強化学習と運動学習という二つの学習がある強化学習は実感のある、大脳系の学習普段、誰しもがやるのがこちらやった感はありますがこれで改善に向かうか?というと、使い方次第なのかな、と思います運動学習は実感のない、小脳系の学習例えば立った状態で片脚ずつ挙げるやりやすかった側と同
『「免罪符」②』『「免罪符」①』(私)「免罪符」ってなんでしたっけ?(chatGPT)「免罪符」とは、カトリック教会が中世ヨーロッパで発行していた証書の一種で、罪の償いや罰を…ameblo.jpのブランチ(私)「くるくる輪廻ボードゲーム」という新作ゲームを考えました。このゲームをやることによってプレイヤーは輪廻転生のシステムを自動的に学ぶことができます。このゲームは下位の生物から上位の生物に輪廻していき、最終的に解脱(ゴール)します。その生物が死んだときにカルマ値が一定のレ
都心3区は言う迄も無く、《千歳烏山駅前広場南側地区》という意表を突いたエリアが対象になる程市街地再開発事業が相次いで施行されている東京都内ですが、再開発とは関係無く、老朽化によって更新されるビルも相次いでいます。三愛ビル解体、建て替え銀座照らし60年次の未来へ「光の円筒」街の記憶つなぐ:東京新聞TOKYOWeb銀座四丁目交差点の一角に立つビル「三愛ドリームセンター」の建て替え工事が今月から始まった。銀座の街のシンボルの一つとして、六十年にわた...www.tokyo-np.co.
2022.12.14(3)人工知能理解への案内GuidetoUnderstandingArtificialIntelligenceテーマ:英語のお勉強日記(7309)カテゴリ:人工知能WhatIsGeneralAIAndWhatCanItDo?一般的なAIとは何か、それが何をできるか?Now,thisisthebestformofAIasitteachesmachinesorsoftwaretodothething
私は理系だったが文系就職したので、脳科学という言葉にも興味がなかった。で、転職先で研究職としてガチの研究をしていた時に「脳科学」を知った。その当時の研究所のトップが、川人光男先生の信者でいろいろな話を聞かされ、本を読みました。一応、私も数学はしていたつもりですが、本を読んでも理解できないことが多かったのを覚えています。川人光男/MitsuoKawatobicr.atr.jpそうそう、「脳の計算理論」を読むように勧められた。脳の計算理論Amazon
AIの進歩には、アンテナを張って情報を集めています。時代の変化についていけないと。大変ですからね。Metaの研究者が画像・音声・文字を同じように学習するAIを開発|TechCrunchJapanAIの領域には常に進歩が見られるが、それは1つの分野に限定される傾向がある。例えば、合成音声を生成するためのクールな新方法は、人間の顔の表情を認識するための方法とはまた別の分野だ。Metaの研究者たちは、もう少し汎用性のあるもの、つまり話し言葉、書かれた文字、視覚的な認識を問わず、自分でう
馬券を買わないと言って・・・買ってしました。■日経新春杯結果⑩ヨーホーレイク④ステラヴェローチェ⑥ヤシャマル<予想>2018105012ヨーホーレイク01088...71.89610060.75050086.5712902017105438クラヴェル00660...66.08732969.91918685.5672672017106161モズナガレボシ01126...65.705562
前に読んだときも「あまりよくわからないなあ」という印象を受けましたが、今回改めて読んでもやっぱりよくわかりませんでした。価値、方策、報酬といった強化学習の考え方がちゃんと身についてないことに加え、それらを関数近似するためにニューラルネットワークを使う点がややこしく絡み合っているせいでしょうか。単純なトイプログラムでは何とか理解できるのですが、実問題に適用しようと思うと何をどうすればよいのかが途端にわからなくなります。もっと事例が豊富な本を読んで、なるべく実例に基づいて理解を