ブログ記事15件
「最小二乗法」(最小自乗法)は、誤差(ばらつき)を伴う測定値の処理において、その誤差の二乗の和を最小にするようにし、最も確からしい関係式を求める方法(Wikiより)です。何やら難しそうな気がしますが、高校あたりの数学や物理などで出てきます。例えば、測定値(x0,y0)~(x4,y4)があり、下図のようにプロットされるとします。それらのデータを線形モデルy=ax+bによって表現するとき、測定データとこのモデルとの間にある誤差を最小にしたいと考えます。最小二乗法では、
過去44年分の米沢降雪量データでの近似曲線です。統計的判断とは違いますが、近似曲線をみると今まで大雪と少雪はほぼ4年毎に規則性がありました。なので、その規則性からすると昨年は大雪になると予想したのですが地球温暖化による右肩下がりの影響の方が大きくて結果的に大雪にならなかった。という見方なんだと思います。
Excelで「平均」というと「AVERAGE」関数を思い浮かべるかもしれませんが、ときとして他の平均処理が必要なときもあります。平均にはAVERAGE関数で行う「算術平均(相加平均)」のほかに加重平均幾何平均(相乗平均)調和平均トリム平均移動平均などがあります。ここでは、加重平均と移動平均についてExcel関数での演算方法をご紹介します。簡単な例ですが、下図の表を使ってみます。これらの商品の平均価格(単価)は、「単価」列のデータについて「=AVERAGE([単価])」
過去43年分の米沢降雪量データでの近似曲線です。統計的判断とは違いますが、近似曲線をみると大雪と少雪はほぼ4年毎に規則性があります。昨年は大雪側の2年目となるので規則性からみると3年目の今年は大雪かもしれません。。。。
7月からYoutube状のハロプロ関係MV700曲ほどのMV再生数をYoutubeAPIで自動取得・記録を続けてきまして、40日程度のデータが集まりました。これ↑は、つばきファクトリーのMVを抽出、集計した結果です。表2列目の経過日数はYoutubeにアップされた日からの経過日数で、8月9日現在です。再生数は7月2日と8月9日のそれぞれ00:00での値です。今夜だけ、低温、サンライズ、三回目、ふわりの順。あとはちょぼちょぼですね。これがつばきファクトリーのこれまで蓄積された実力ですね。
過去42年分の米沢降雪量データでの近似曲線です。統計的判断とは違いますが、近似曲線をみると大雪と少雪はほぼ4年毎に規則性があるので一昨年を底として昨年は平年並みに戻した。規則性からみると今年と来年は大雪かもしれません。。。。
先の「Excelバブルチャート」でご紹介した「バブルチャート」は3種類のデータ(x値、y値、z値)でなるデータセットの相関関係を見つけるときに使いますが、2種類のデータの相関関係を見つけるのに向いているのが「散布図」です。下表のようなデータを使ってご紹介します。この表データのうち、B1~C9セル範囲を選択し、[挿入]タブ[グラフ]グループ[散布図]をクリックすると散布図ができます。(下図)上図は見やすいように、横軸の範囲を制限しマーカーのサイズを少し大きくしています。同じ
先日の診察でマーカー値が高かったので、数学的なアプローチで今後の予測を実施してみました。先日までの値を使用して作成される近似曲線からわかることは、一旦上昇して基準値から外れるものの、また基準値内に復帰する結果となりました。合っているかどうかは神のみぞ知る。10月頃が楽しみです〜😋ちなみに常用対数を使用しています。
Windows10ネタではありませんが…エクセルのグラフで、たまにプロットした点データに、近似曲線を描画したいことがあります。これは非常に重宝しているのですが、凡例に「多項式」って項目が表示されてしまいます。これって消せないかなってずっと思ってたのです。ところが簡単に、任意の凡例を消すことができる事が分かりました。凡例を2回クリックすると、特定の凡例だけ選択できます。ここで右クリックすると、メニューが出てきて、選んた凡例だけを削除できます。以上
この前の投稿では17時現在で発表された(NHKニュースシブ5時)感染者数をもとに作ったグラフを載せましたが、19時のNHKニュース7で発表された感染者数は6,000人を超えて6,068人となりました(17時は5,694人)。それをもとにグラフを作り直すと下のようになります。感染者数は指数関数的に増えるので、増加の様子を直線で表すのには限界があります。現時点は赤線より増加した緑線に移ったように思われます。日ごとに直線の傾きが大きくなり、感染者数の予想は指数関数を使わないとで
最初に申し上げておきますが、以下は、素人の私がちょちょっとエクセルでやってみた1つの分析に過ぎず、理論的に意味のある分析ではないものとしてご覧ください。世界中で猛威を振るっている新型コロナウイルス。そんな中、日本は頑張っているという話があります。先日の首相会見では、イベント等の自粛により一定程度の効果が出ていると言っていました。これ↓は、日本における新型コロナウイルスの感染判明者数(クルーズ船乗員乗客らの人数を含まず)の推移グラフです。※元データは朝日新聞デジタルより橙色はその日
過去40年分の米沢降雪量データでの近似曲線です。統計的判断とは違いますが、近似曲線をみると大雪と少雪の規則性があります。4シーズン平均の下に入ったので規則性があることは証明されました。この規則性は数シーズン少雪が続くと大雪シーズンが数シーズン続くというもの。ここからが予想が難しいのですが規則性から考えると今年は大雪パターンに移行してもおかしくない。
過去39年分の米沢降雪量データでの近似曲線です。統計的判断とは違いますが、近似曲線をみると大雪と少雪の規則性があります。3シーズン平均の下に入ったので規則性は証明されました。規則性は3シーズン少雪が続くと次の年は大雪パターンに移行します。よって今年は反転して大雪。皆さん残念ながら今年の冬は大雪の可能性が高い。と思われます。
過去39年分の米沢降雪量データのヒストグラムです。n=39のデータは綺麗に正規分布しています。自然界の正規分布は凄いものです。「正規分布している」ここが大事!次は近似曲線です。