強化学習

ブログ記事64件

このタグで投稿する

プログラミング言語「Python」で制作 Part44
Photoshop CC Tutorials2024年03月21日 08:52
今回はプログラミング言語の「Python」を使って作成しました。Q学習のプログラムです。学習が進むとねずみが敵を避けゴールに向かうようになります。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考書「Pythonでつくるゲームプログラミング入門」■ゲーム用ライブラリ「pyglet」■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【Q学習】強化学習を初学者向け
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part43
Photoshop CC Tutorials2024年03月20日 22:54
今回はプログラミング言語の「Python」を使って作成しました。Q学習が視覚化できるようにプログラムを作成しました。学習が進むとねずみが敵を避けゴールに向かうようになります。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考書「Pythonでつくるゲームプログラミング入門」■ゲーム用ライブラリ「pyglet」■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part42
Photoshop CC Tutorials2024年03月19日 19:38
今回はプログラミング言語の「Python」を使って作成しました。Q学習をやってみました。A:エージェント,0:道,1:ゴール,2:壁,3:トラップ■参考サイト01「【入門】Q学習の解説とpythonでの実装〜シンプルな迷路問題を例に〜」■参考サイト02「【Q学習】強化学習を初学者向けにわかりやすく解説！Pythonで実装」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part41
Photoshop CC Tutorials2024年03月18日 15:21
今回はプログラミング言語の「Python」を使って作成しました。ディープニューラルネットワーク（DNN）のライブラリを自作し、ランダムマップ100個用意してキャラクターにアイテムを拾わせる方法です。■参考書「Pythonで学ぶAI・数学・アルゴリズム」■参考サイト「【入門】ニューラルネットワークとは【40単語以上を網羅的にまとめました】」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part40
Photoshop CC Tutorials2024年03月18日 10:56
今回はプログラミング言語の「Python」を使って作成しました。ディープニューラルネットワーク（DNN）のライブラリを作成し、XOR回路を実現しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」■参考サイト「【入門】ニューラルネットワークとは【40単語以上を網羅的にまとめました】」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part39
Photoshop CC Tutorials2024年03月16日 01:53
今回はプログラミング言語の「Python」を使って作成しました。下図のような5つの入力を持つ多層パーセプトロンを自作しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part38
Photoshop CC Tutorials2024年03月15日 18:32
今回はプログラミング言語の「Python」を使って作成しました。XOR回路をニューラルネットワーク(多層パーセプトロン)で作成しました。■参考書「Pythonで学ぶAI・数学・アルゴリズム」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part37
Photoshop CC Tutorials2024年03月13日 19:23
今回はプログラミング言語の「Python」を使って作成しました。ニューラルネットQ学習でコンピュータに100000ステップ、学習させてみました。80~90%くらいの確率で青色のクリスタルを拾うようになりました。■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part36
Photoshop CC Tutorials2024年03月13日 15:00
今回はプログラミング言語の「Python」を使って作成しました。Q学習でコンピュータに10000ステップ学習させてみました。ほぼ100%の確率で青色のクリスタルを拾うようになりました。■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part35
Photoshop CC Tutorials2024年03月13日 14:20
今回はプログラミング言語の「Python」を使って作成しました。入力層に120個のデータ、中間層に128個のユニット、出力層に1個のユニットを持つニューラルネットワークです。■Pythonの実行環境Python:3.9.4TensorFlow:2.11.0NumPy:1.26.4Matplotlib:3.8.3■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part34
Photoshop CC Tutorials2024年03月13日 13:45
今回はプログラミング言語の「Python」を使って作成しました。入力層に30個のデータ、中間層に32個のユニット、出力層に1個のユニットを持つニューラルネットワークです。■Pythonの実行環境Python:3.9.4TensorFlow:2.11.0NumPy:1.26.4Matplotlib:3.8.3■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part33
Photoshop CC Tutorials2024年03月13日 08:19
今回はプログラミング言語の「Python」を使って作成しました。2層の3つのニューロンモデルから構成されるシンプルなニューラルネットワークです。■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part32
Photoshop CC Tutorials2024年03月13日 07:42
今回はプログラミング言語の「Python」を使って作成しました。シグモイド関数です。■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
プログラミング言語「Python」で制作 Part31
Photoshop CC Tutorials2024年03月13日 00:49
今回はプログラミング言語の「Python」を使って作成しました。線形回帰モデルです。平均二乗誤差(MSE)を計算して、勾配法で重みを求めています。■参考書「「強化学習」を学びたい人が最初に読む本」
- いいね
- コメント
- リブログ
久々の東京
とっくに還暦すぎたのに、まだまだ現役エンジニア2023年11月05日 16:38
皇居三の丸尚蔵館という美術館が一昨日の文化の日にオープンって事で行ってきました。もともと施設としてはあったのですが、展示空間を大きくしてのリニューアルオープンだそうです。入館は時間指定の事前予約制です。一昨日予約をしたのですが、今日の午前中に予約を取ることができました。久々の東京。毎週一度は事務所のある天王洲アイルへ行くため品川までは行ってますがその先は行かない。前の会社では有楽町の事務所にも通勤はしていたし、しょっちゅう東京から新幹線乗っていたのでコロナ前までは普通に行っていた東京
- いいね
2023自動車技術会・秋季大会:二輪の最新研究をレポート
Motorcycle Professorのブログ2023年10月12日 15:50
本日は、自技会主催の秋季大会を聴講してまいりました。もちろんセッションは二輪車の運動・制御・安全Iです👍まずは、近畿大学の酒井先生のウイーブ・ウォブル対策の鍵はキャスタ角ウイーブ・ウォブル（自励振動）の開発においてパラメータスタディに時間を要するとの声を聞く．そこでその戦略を本論文は考察する．まず「全」設計変数における自励振動発生領域を図示し，次にその影響から設計変数を分類した．その結果キャスタ角の影響を大域的に把握しながら設計するべきとの結論を得た．と言うものです。簡潔に一言で言
- いいね
- コメント
- リブログ
Pythonで実践する強化学習と転移学習
ナナとトモのブログ2023年08月04日 14:27
強化学習に関する本はいろいろ出ていますが、状態価値関数やら行動価値関数やら方策やらベルマン方程式やらややこしい話が満載で、結局何をどうすればよいのかよくわからなくなります。この本はタイトルに「実践」とあるように、理論よりもプログラムを動かして体で理解することを目指しているのがわかりやすくてよいところ。プログラムも著者と関係者が少しずつ拡張してきたものらしいので、かなりわかりやすいと思います。ただ転移学習については自分があまりやりたいと思う状況がなく斜め読みしたのでちゃんと読
- いいね
- コメント
- リブログ
猛暑続き
アルと毎日ぶらぶらと2023年07月21日 13:34
今日も暑い今日は一応仕事は休み。水曜はトリミングでした。ペンダントがアイスクリームでなんか涼しげ。耳の毛はかなり長め。たしか再来週の日曜が土用だったか、やはりこの季節に一度はうなぎでもと思って竹葉亭を予約しようと思ったら、８月末まで繁忙期なので予約できないということ。それでは、と思い、そごうへ早めに行き一番狙いで10時半頃一度店を見に行ったらさすがに誰も並んでなんかいない。でもわからないので開店10分前の10時50分頃に行ったら本当に一番でした。そ
強化学習②
40代・元脳研究者の夢実現メモ日記2023年06月09日 06:25
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、前々回の『強化学習』で書き漏れていた内容を書いていきます。強化学習の手法として、モデルフリー方策ベースモデルフリー価値ベースモデルベース（モデルベース方策ベースモデルベース価値ベース）があります。モデルフリー方策ベースは、ある状態に対してある行動を起こす確率をパラメトリックな関数で表現し、この関数を用いて一連の行動による報酬の期待値を求め、期待値が大きくなるように関数のパラメー
- いいね
- コメント
深層強化学習
40代・元脳研究者の夢実現メモ日記2023年06月08日 06:25
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、『深層強化学習』について書いていきます。深層強化学習は、ディープラーニングと強化学習を組み合わせた手法です。エージェント(学習モデル)が環境との相互作用を通じて学習し、最適な行動をとるための方策を獲得することを目指します。深層強化学習とすることで、強化学習よりも状態や行動の組み合わせが多い場合の学習が可能になりました。これにより、縮約表現の必要性が緩和されました。縮約表現とは、状態の重要
- いいね
- コメント
強化学習
40代・元脳研究者の夢実現メモ日記2023年06月06日 06:25
おはようございます。今日も読みに来ていただき、ありがとうございます。今日は、『強化学習』について書いていきます。強化学習は、機械学習の一部で、与えられたデータをもとに試行錯誤して学習し、データの価値を最大化する方法です。強化学習では、環境と学習目的を設定します。環境は状態、行動、報酬、遷移確率などを内包します。行動主体であるエージェントが環境内で学習目的を達成するように、状態に対する最適な行動選択の学習を行います。また、行動選択の結果、エージェントは報酬を得ます。学習目
- いいね
- コメント
強化学習と運動学習
「人も馬もみれる、さすらいの理学療法士」吉川修二のブログ2023年06月06日 02:35
先日、二日間の公認講座を受講してきました公認講座も5年目なんですかねえ(PT何年目とかもよくわかっていない、時間の流れが早くて(笑))この二日間は動きまくった二日間でした自分の弱さを痛感させられました人間には強化学習と運動学習という二つの学習がある強化学習は実感のある、大脳系の学習普段、誰しもがやるのがこちらやった感はありますがこれで改善に向かうか？というと、使い方次第なのかな、と思います運動学習は実感のない、小脳系の学習例えば立った状態で片脚ずつ挙げるやりやすかった側と同
- コメント2
- いいね
- コメント
- リブログ
「くるくる輪廻ボードゲーム」
不惑のクワガタ日記2023年04月22日 08:00
『「免罪符」②』『「免罪符」①』（私）「免罪符」ってなんでしたっけ？（chatGPT）「免罪符」とは、カトリック教会が中世ヨーロッパで発行していた証書の一種で、罪の償いや罰を…ameblo.jpのブランチ(私)「くるくる輪廻ボードゲーム」という新作ゲームを考えました。このゲームをやることによってプレイヤーは輪廻転生のシステムを自動的に学ぶことができます。このゲームは下位の生物から上位の生物に輪廻していき、最終的に解脱（ゴール）します。その生物が死んだときにカルマ値が一定のレ
- いいね
- コメント
- リブログ
強化学習するエージェントの行動は愛おしい（令和5年3月15日）
【アトリエこくらげ】の《週末おさんどん》2023年04月09日 07:07
都心3区は言う迄も無く、《千歳烏山駅前広場南側地区》という意表を突いたエリアが対象になる程市街地再開発事業が相次いで施行されている東京都内ですが、再開発とは関係無く、老朽化によって更新されるビルも相次いでいます。三愛ビル解体、建て替え銀座照らし60年次の未来へ「光の円筒」街の記憶つなぐ：東京新聞TOKYOWeb銀座四丁目交差点の一角に立つビル「三愛ドリームセンター」の建て替え工事が今月から始まった。銀座の街のシンボルの一つとして、六十年にわた...www.tokyo-np.co.
- いいね
- コメント
- リブログ
(3)人工知能理解への案内
情報開発と利活用2022年12月15日 08:55
2022.12.14(3)人工知能理解への案内GuidetoUnderstandingArtificialIntelligenceテーマ：英語のお勉強日記(7309)カテゴリ：人工知能WhatIsGeneralAIAndWhatCanItDo?一般的なＡＩとは何か、それが何をできるか？Now,thisisthebestformofAIasitteachesmachinesorsoftwaretodothething
- いいね
- コメント
- リブログ
脳科学は25年ほど前に知った
零細企業経営者の魂2022年11月04日 11:04
私は理系だったが文系就職したので、脳科学という言葉にも興味がなかった。で、転職先で研究職としてガチの研究をしていた時に「脳科学」を知った。その当時の研究所のトップが、川人光男先生の信者でいろいろな話を聞かされ、本を読みました。一応、私も数学はしていたつもりですが、本を読んでも理解できないことが多かったのを覚えています。川人光男／MitsuoKawatobicr.atr.jpそうそう、「脳の計算理論」を読むように勧められた。脳の計算理論Amazon
- いいね
- リブログ
Metaの研究者が画像・音声・文字を同じように学習するAIを開発
ともぞうのブログ　昨日の自分を超えてゆけ！2022年01月23日 18:39
AIの進歩には、アンテナを張って情報を集めています。時代の変化についていけないと。大変ですからね。Metaの研究者が画像・音声・文字を同じように学習するAIを開発|TechCrunchJapanAIの領域には常に進歩が見られるが、それは1つの分野に限定される傾向がある。例えば、合成音声を生成するためのクールな新方法は、人間の顔の表情を認識するための方法とはまた別の分野だ。Metaの研究者たちは、もう少し汎用性のあるもの、つまり話し言葉、書かれた文字、視覚的な認識を問わず、自分でう
- いいね
- コメント
- リブログ
【結果】”日経新春杯の予想（Python＋MysqlによるNet競馬スクレイピングデータ解析）”
エド金融道　（息子が「めしが食える大人になる」編）2022年01月18日 14:18
馬券を買わないと言って・・・買ってしました。■日経新春杯結果⑩ヨーホーレイク④ステラヴェローチェ⑥ヤシャマル＜予想＞2018105012ヨーホーレイク01088...71.89610060.75050086.5712902017105438クラヴェル00660...66.08732969.91918685.5672672017106161モズナガレボシ01126...65.705562
- いいね
- コメント
- リブログ
強化学習アルゴリズム入門
ナナとトモのブログ2021年12月22日 08:58
前に読んだときも「あまりよくわからないなあ」という印象を受けましたが、今回改めて読んでもやっぱりよくわかりませんでした。価値、方策、報酬といった強化学習の考え方がちゃんと身についてないことに加え、それらを関数近似するためにニューラルネットワークを使う点がややこしく絡み合っているせいでしょうか。単純なトイプログラムでは何とか理解できるのですが、実問題に適用しようと思うと何をどうすればよいのかが途端にわからなくなります。もっと事例が豊富な本を読んで、なるべく実例に基づいて理解を
- いいね
- コメント
- リブログ

次の30件