ブログ記事64件
みなさん文字コードってご存じですか。コンピューターは文字を認識しないので、各文字に数字を割り当てて認識したり送ったりするためのコードなのですが、昔はちゃんと表示されない文字化けだって多かったですよね。こんばんは。トロンボーン吹きで作編曲家、吹奏楽指導者の福見吉朗です。ウェブサイト6年前に自分のホームページをリニューアルしたときに…ウェブ標準の文字コードは『UTF-8』だと聞いていたので、よく考えもせずそれで書きました。リニューアル前は『Shift-JIS』で書いてい
しまった...昨夜は、パンを焼いたのですが、うっかり、そのまま、失念して、寝てしまいました。パン焼き機で焼いたパンは、焼きあがったら、焼き窯?パンケース?から、すぐに出さないと、パンが、湿気た感じになってしまいます。パンが、しわしわ。わたしも、しわしわ。(どこが?)(足の裏?)歳をとってくると、いつ焼いたパンなのか、まったく覚えていられなくなってくるので、(大げさね。)パン入れ?の横には、焼いた日にめくっておいた、日めくりカレンダーを、置いておきます。もちろん、これは、日めくりカレンダーな
曇り空の木曜日。気温がそれほど低いというわけではないのですが、陽射しがないので寒い。昨日、古いソフトでテキストデータを処理しようとしたら、謎の文字列が出現。最近のwindowsの文字コードはUTF8なのに古いソフトはshift-JISしか認識できないから文字が化けたのです。去年まではこんなことはなかったのだけれどなぁ。まぁ、メモ帳とかでshift-JIS(ANSI)に変換してやればいいのですけれどね。文字コードって、普通に使っている分には意識する必要がないけれど、いまだに時々
プログラミング言語を使用してコードを書く際には変数を使用して変化する値を保存して使用することになりますが、コンピューターでは計算だけでなく文字列の取扱もできるので、変数には■数字■文字を格納できるようになっています。コンピューターの制御は機械語で行えるので十六進数を使用することになりますが、この際に10位上の値は2桁になってしまうので、これを一桁に収めるためにアルファベットのA~Fを用いて処理をする仕組みになっています。そのため、1970年台に登場した7セグ表示のLEDを
今は文字コードとしてはUTF8だけを扱っていればだいたい大丈夫な時代になっていますが、少し前はUNICODEでもUTF16でいくのかとかUTF8のBOMをどうするのかとか混乱がありましたし、もっと前は日本語を扱うだけでもいろいろ文字コードがあって大変な時代でした。この本は改訂新版なので旧版に加筆修正してると思われますが、正直今となってはUNICODEに統一されて「文字コード変換」が必要な場面がかなり減ったので8割以上は知らなくてもよい話題ばかりです。も
前回「Excelピボットテーブルのデータを並び替え」記事と同様、Googleスプレッドシートにおいても集計データの並べ替えができます。ただし、Excelでの操作と比べ、出来ることは少ないです。前回と同様な表データ(データベース)をここでも使ってみます。(下図)ピボットテーブルエディタで「行」に「機種コード」、「値」に「売上額」とすると、下図のように集計されます。集計データのA列「機種コード」のデータは、初期状態で文字コード順、つまり文字を昇順でX203H、X205P、‥‥
Excelで表データを集計するとき、ピボットテーブルを使って行うことが多いですね。データが多くても、項目(フィールド)を「行」「値」ボックスなどにドラッグ&ドロップするだけで素早く集計できます。例えば、下図のように容易に集計できます。これはこれで良しとする場合もありますが、ときには売上額の大きい順に表示したいときもありますね。ピボットテーブルでは、軸とする項目、上図では「担当者」で集計すると、その担当者名の文字コード順に並べられます。もし「列」項目もある場合は、列項目の文字コード順
「文字コード」記事をはじめ、多くの記事で文字コード「UTF-8」という表記が出てまいります。その名前についてはよく目にするものの、その仕組みなどについては知らないという方が多いのではないでしょうか。今回は、「UTF-8」について少しだけ詳しくご紹介していきます。文字コードには「ASCII」「JIS」「Shift-JIS」などが良く知られますが、世界中の文字を含むコード体系として「Unicode」が考案されました。Unicodeは、文字に番号(コードポイント)を割り当てる規格です。UTF
文字コード変換ツールサイトをまとめたプチメモ帳文字化けなどにも有効的なサイトのまとめso-zou.jp複数の文字コード方式に一括変換|エンコード/デコードツール複数の文字コード方式に一括して変換されるため、エンコーディングを気にせず使用できます。so-zou.jpAHREFhttps://www.ahref.org/mojicode.phpLUTTOOLS文字コード変換文字コード変換は、テキストの文字を別の文字コードに変換(デコード・エンコード)できるツールを
過去にアップした「ExcelCSV形式のファイル」記事でご紹介しましたように、「CSV」は「Comma-SeparatedValues」の頭文字で、複数の値(value)を「,」(commma、カンマ)で区切って(separated)並べて格納したデータ形式です。そして「ExcelCSV形式との関わり」記事の最後に少しだけ触れましたが、CSVファイルの文字コードが問題になることが多いので、文字コードに絞って補っておきます。下図のようなExcelの表データがあるとき、この住所録データを
パソコンであるフォルダを見ていて、並び順がおかしいことに気付いた。第一課第三課第四課第二課何故か第二課が、4番目に来る。クリックして並べ直してもこの順になる。「これは、間違ってカタカナの「ニ」を使っているのだろう。」フォルダの名前を付ける時に、並び順を意識して、名前の中に数字を含めてつけることがある。こんな感じだ。100_小学校200_中学校300_高校ということで、第二課の「二」を正しいもの(漢数字の2)に直したが、やっぱり順番が、おかしい。
Windowsの標準アプリ「メモ帳」は、文字通り、メモ帳のようにさほど大きくない文章書きに使われることが多いテキストエディタ―です。その「メモ帳」アプリもWindows11になって、デザインが大きく変わりました。上述したように、Windowsに付属するアプリなので、基本的にインストールする必要はありませんが、誤って削除してしまった場合にはMicrosoftSoreで「WindowsNotepad」を探しインストールすればまた使えます。「スタートメニュー」から[すべてのアプリ]-
Wordで作成した文書をHTMLファイルに変換することができます。ホームページを作成する上で、なかなかHTML、CSSなどの言語が覚えられないという方でも、Wordで作成し、それをHTMLファイルに変換すればWebページを作れるわけです。(少しだけ体裁を整える作業が必要になることもありますが‥‥。)ちなみに、Wordを開いて[表示]-[Webレイアウト]を選択すれば、Webページに変換後の文書として表示され、その表示モードの中でも文書編集ができます。(下図)作成したWor
前回「WebページはShift-JIS、UTF-8どちらが良い?」記事で、WebページのHTML、CSSファイルなどを新規に作成するなら「UTF-8」文字コードにしましょう、ということをお話しました。強制力は弱いですが、HTML5では「UTF-8」が推奨されていますので、特にこだわりが無ければ「UTF-8」とすると良いでしょう。それでも、以前に作成したファイルが「Shift-JIS」で書かれていたら、それを「UTF-8」にしたくなることもあると思います。お使いのテキストエディタに文字
ホームページを自分で作成し編集するときに、HTMLファイルなどに使用する文字コードを「Shift-JIS」とするか「UTF-8」とするか迷いますね。文字コードは、コンピュータ上で扱う文字に与えられた番号のことで、全ての文字情報に対して数値を与えています。問題は、この文字コードがいくつもあって、正しくWebブラウザなどが認識しないと「文字化け」してしまうようなことが起きます。よく使用される代表的な文字コードは以下の4つでしょう:JISShift_JISEUC(EUC_JP)Uni
漫画の吹き出しセリフなどで「あ゛」や「お゜」というように濁点「゛」、半濁点「゜」を付けて新たな擬音(?)を表現することがありますね。これら濁点や半濁点はどのように入力するのでしょう?これはとても簡単です。最初の文字を入力後「だくてん」とタイプして変換すると「゛」が、「はんだくてん」とタイプして変換すると「゜」が表示されます。(下図)もちろん、最初に「濁点」と変換された場合には、再度変換キーを押して他の変換候補を表示させれば「゛」が見つかると思います。(下図)「環境依存」と表示さ
訪問ありがとうございます!コッシーと申します幼児二人を育てるワーママです。子供との日常の事も書いています仕事中の話。どうしてもExcelで隆の旧字体が出したかったんです。生の上に漢数字の一が入る文字が出したかったんですで、IMEパッドを使っても出なくて困って、、検索したらところhttps://okurukotoba.tokyo/archives/7524「隆」の旧字の出し方!パソコンの変換キーでの方法も解説!|贈る言葉情報館漢字の「隆」。「西郷隆盛」など、名前にもよ
Subconv_toUTF8(ByValfile_fromAsString,ByValfile_toAsString_,OptionalByValisMode_overwriteAsBoolean=False_,OptionalByValcharset_originalAsString="Shift-JIS")Dimf_readAsNewADODB.StreamDimf_writeAsNew
CSVとは、CommaSeparatedValueのこと。フィールドとレコードからなるデータを、各種プログラム間でやりとりする際によく使われる。メモ帳アプリでも扱えるテキストで、各行がレコードに、カンマでられた部分がフィールドに対応する。フィールドの中にカンマがある場合などは、フィールド全体をダブルクオート(”)で囲って区別する。(このため、フィールドの中のダブルクオートを表現する場合に、ダブルクオートを2つ並べることがある。)ファイルの拡張子が.csvとなって
今日はいい夫婦の日で、例によって結婚記念日でもあり、肉喰って満足しました。。さて放送大学関連では「情報処理とデジタル表現」の学習を進めており、第11回までの放送授業を視聴しました。基礎理論的なところが終わって、具体的な符号化の話にはいってきました。この辺はまぁ仕事でも扱うところなのでさらさらっと切り抜けていきたい所存です。では、また。2022度2学期の進捗状況解析入門(放送)放送授業→7回完了/15回通信指導→完了(7/10)自習問題→未着手認定試験→未着手情
先日入手したX-Windowの書籍に載っているサンプルプログラム(付箋紙)をM1Macでルドしてみました。XWindow練習帳―Xの基本ライブラリ「Xlib」で遊ぶ!(I・OBOOKS)Amazon(アマゾン)207〜16,204円背景に有る様に実行時に文字列を渡すと、その文字列を小さい付箋のウィンドウに表示するプログラムです。Macのターミナルから実行してみると、実行コマンド列では日本語入力ができていますが、実行結果では文字化けしてしまいました。プログラムの中では
JISコード(1バイト)では、16進数の”5C”を円マーク(半角の「¥」)に設定している。ASCIIコードではバックスラッシュにあたる部分である。このため、日本語フォントでは「半角の¥」と表示される部分が、環境によっては「バックスラッシュ」(左上から右下への斜め線)で表示されることがある。16進数で”A5”に当たる部分にも「半角の¥」がある。この表示の場合は、欧文フォントでも円マークが表示される。MicrosoftIMEでは、「えん」を変換した際に、前者は「半角」
こんばんはアラフィフのパートアルです前を走ってる車を見たらキンチョウのマークとサッサの文字か、かわいい‼️社用車、すてきだわと、思わずパシャリキンチョウの夏って書くんではなくてサッサの文字にしびれたアルなのでした初めて見たキンチョウの社用車でウキウキ初めてと言えば今日、専務があーーもう💢💢💨この漢字が出てこんと、イラついていたので、パソコンの画面を覗いてみると、取引先の担当者の名前の欄に祐の文字が、、、、専務これぢぁなくてしめすへんに、右なんや❗
■動機VBAでは「?」となって扱えない空白や文字を何とかしたい。■状況WEBから読み込んだ文字がエクセルVBAで扱えない。下の「」内は、VBAではいずれも「?」になってしまう。「〜」←VBAにコピペすると?になります。「」←ここでは正しいようですがWEB取込では?です。この空白はReplaceやTrimを使っても削除できません。空白のように見えても空白ではないようです。このままではこれらを区別することすらできません。■解決策下記の1)→2)を順に行う。1)
Unicode、UCS、UTF-8…その他諸々…右から左に読み書き?接頭語??根号???Eng-US、Eng-UKには困らんのだが…混乱するわ💦精通してるヤツがやれ😅
3月に入ってから初出社。ずっと在宅勤務だったので、久しぶり。明日、システム移行作業を予定していて、事前作業を含めて今日から3日間は出社する予定。今日は移行前の事前確認作業として、本番データを使って、新システムに登録するデータを確認していたところ、一部のデータが文字化けしていることに気づいた。明日切り替えのシステムなのに、この直前のタイミングで気づいてしまった。ShiftJIS系の文字コードは複数の種類があって、今回データ出力に指定していたのが、MS932というよく使
過去に「ExcelCSV形式のファイル」記事で「CSV」形式のデータについてご紹介しました。今回は、上記記事でお話しなかったことを“補足”してお伝えします。古くから使われているデータ形式で、複数の項目データを「,」(カンマ)で区切って並べ、さらにデータセットが複数行ある場合には各行の末尾に改行コードを含めるといったとてもシンプルな形式です。拡張子は「.csv」で、例えば「sample.csv」というデータファイルをダブルクリックして開くと、既定ではExcelがそのファイルを開くようにな
前回の記述に続けます。ホームページの構成を記述するHTMLページをいきなり怖いもの知らずで、作ってみます。TeraPadを起動して(トップページに張り付けてある“TeraPad”のマークをダブルクリック)現れた白紙ページに次の操作にかかります。1.ガイドには、まず、<!DOCTYPEhtml>と書けとある。「この文書がHTMLであることを宣言する」一つ目のまじないである。続けて2.<html>と</html>の出番である。<html>で始め、</html>で、閉める。
実験のためテキストファイルを読み込もうと思うと文字コードが合わなくてうまく読み込めないことがある。最近はだいぶutf-8に統一されてきたが古いファイルは違う文字コードのこともあるのでしょうがない。そういうファイルはlatin-1で読み込めることが多いがときどきlatin-1で定義されていない0x96のようなバイトが含まれるものがあり、以前から疑問に思っていた。調べていくとWindows-1252という、latin-1を拡張した文字コードがあり、0x96
画面上で電光掲示板を再現してみた。8X8LEDを使った電光掲示板を作るために画面上で動作確認用に作ったプログラム。上段が16X16ドットの東雲(しののめ)フォントを使ったもの。下段が前回作成した8X8の美咲フォントを使用したもの。(↓8X8ドットで作った当時の記事)『8x8マトリクスLEDとラズベリーパイでニュース掲示板を作った』ようやく完成したRaspberryPiと8x8マトリクスLEDで、外部からデータを拾ってスクロール表示する掲示板に、外からニュースデータを拾ってきて