2008-02-29
嫁と娘が新潟から帰ってきました。行きは高速バスにトライしてということですが、娘はおとなしくしていられたそうです。でも、やはり時間がかかりすぎて疲れたとの事。帰りは新幹線。時間と快適さのためならお金を出してもいいんじゃないかと思います。 帰りに娘が大人の足で15分程度の道のりを30分かけて自分で歩いたとの事。立派立派。
嫁と娘が新潟から帰ってきました。行きは高速バスにトライしてということですが、娘はおとなしくしていられたそうです。でも、やはり時間がかかりすぎて疲れたとの事。帰りは新幹線。時間と快適さのためならお金を出してもいいんじゃないかと思います。 帰りに娘が大人の足で15分程度の道のりを30分かけて自分で歩いたとの事。立派立派。
今日はベッドで寝ます。
現在4時45分。客先で作業してます。ちょっとひと段落ついたので休憩。 嫁と娘は実家に帰っているので、のんびり仕事。…というレベルでもないですが…。 またひとつ文字コードに強くなった気がします。でも、まだ混乱中。
最近娘は2歳1ヶ月にして、1から10まで数えられるようになりました。前までは4が無かったりなんだかへんだったのですが、きちんと順番に言えるようになってました。意味がわかって数えられているのかどうかは不明です。
最近はミッキーマウスの昔のDVDがお気に入りです。見ながら一緒に参加しまくってます。 それだけならまだいいのですが、最近は「お父さんみて!お母さんみて!」と、自分がDVDの真似をしているところを集中して見てほしがります。顔だけ娘のほうをむけておいて、夫婦で会話していようものなら納得しません。 見てると面白いんですけどね。。。
力を入れてほしい。ということで毎日片道2時間のところに3月10日程度までは通うことが決定。もちろん残業もバリバリあります。 せめてスキルアップしなくてはやってられませんね。スキルアップしよう。
SJISで「表」などの文字の2バイト目が5cとなっており、プログラム上で\と誤認識され、文字化けが発生する、というお話。 5c 2バイト - Google 検索
日本語情報処理に関して強くなりたいので、調べて理解したことと、まだ理解できていないことを日記に書いていきます。・・・。と、おもって書き出したらなんだかコンピューター入門みたいな感じになってしまいました。まぁ、これはこれで良いことにします。。。。 どのようにしてコンピューターで文字を表現するか コンピュータは1,0の世界だとよく言われます。ONかOFFか。デジタル表現である、と。それはそうなんでしょうけれども、ではそれだけでいったいどのようにしてこれだけ文字も画像も音声も動画も表現できているのか?「きっと偉い人がいろいろなことを考え出してうまいことやってくれているんだろう。」と、それだけの理解で終わってしまうのはもったいないので、まずは文字に関して考えてみます。 上にも書きましたが、コンピュータの世界では1,0で情報をすべて管理しています。これを『ビット』と呼びます。つまり1ビットあれば0と1の2つのパターンを表現することができるわけです。ここでは文字のことを考えているので、たとえば以下のようなルールを考えてみます。 ルール0:1ビット=1文字 ルール1:0に対応する文字として「あ」を設定する ルール2:1に対応する文字として「い」を設定する このようなルールを設定した上で、以下のビットの並びを文字列に変換して読んでみてください。 01000111 どうでしょうか。できましたでしょうか。正解は「あいあああいいい」です。でも、さすがに2文字しか使えないとまともに使えませんね。1ビットで表現できるのは2パターンだけなので、1ビットを1文字に対応させている限りはこのレベルまでしかがんばれなさそうです。それではどうすればもうちょっと使える文字数を増やせるでしょうか? そうですね、1ビット=1文字というルールを変更するしかなさそうです。それでは2ビット=1文字というようにルールを変更しましょう。2ビットあれば00,01,10,11の4パターンが作れますので、文字は4文字使えます。 ルール0:1ビット=1文字 ルール1:00に対応する文字として「あ」を設定する ルール2:01に対応する文字として「い」を設定する ルール3:10に対応する文字として「う」を設定する ルール4:11に対応する文字として「え」を設定する このようにルールを変更した上で、以下のビットの並びを文字列に変換して読んでみてください。 10110001 さて今度はどうでしょうか。正解は「うえあい」です。意味はありません。1ビット=1文字というルールを2ビット=1文字と変更することで0と1の組み合わせで4文字まで表現できることが理解できたでしょうか。どうやらこの調子で1文字あたりに割り当てるビット数を増やして行けばどんどん使える文字を増やしていけそうです。 それではひらがなの50音をすべてルールに乗せるためには、1文字あたりのビット数はいくつ必要でしょうか?数学が得意な人なら簡単だとは思いますけれども、1ビットで表現できるパターンは2パターンなので、1ビット増やすごとにパターンは倍にしていくことができます。1ビットで2パターン。2ビットで4パターン。3ビットで8パターン。4ビットで16パターン。5ビットで32パターン。6ビットで64パターン。どうやら6ビットあればよさそうです。それでは以下のようにルールを変更しましょう。 ルール0:6ビット=1文字 ルール1:000000に対応する文字として「あ」を設定する ルール2:000001に対応する文字として「い」を設定する ルール3:000010に対応する文字として「う」を設定する ルール4:000011に対応する文字として「え」を設定する ルール5:000100に対応する文字として「お」を設定する ルール6:000101に対応する文字として「か」を設定する ルール7:000110に対応する文字として「き」を設定する ルール8:000111に対応する文字として「く」を設定する ルール9:001000に対応する文字として「け」を設定する ルール10:001001に対応する文字として「こ」を設定する (以下省略) それではこれでもうひらがなは全部使えることになりました。以下のビットの並びを文字列に変換して読んでみてください。 000000001011 どうでしょうか?わかりましたか?12ビットしかないので、2文字ですね。はじめの6ビットはすべて0なので「あ」。次の6ビットは「001011」なので「し」です。つまり「あし」でした。つまらない例題ですみません・・・。でも、これで50音は表現できていることがわかりましたでしょうか? でも、ちょっとまってくれという声が聞こえてきそうです。日本語には濁点、半濁点もあれば促音などもあります。さらにいえばカタカナだってあるし、漢字なんてそれこそ大量にあります。それはどうするの?と。 気持ちはわかりますが、まずはスロースタートでいきましょう。ここでは以下のことだけ把握して次に進んでもらいたいと思います。 コンピュータの内部では1,0ですべての情報が処理されている 1,0を表現する最小単位をビットと呼ぶ 勝手にルールをつくれば文字はビットで表現できる 1文字に割り当てるビット数を増やしていけば多くの文字を扱うことができそうだ ASCIIコード なんだかどんどんビット数を割り当てて行けば色々な文字を扱うことができそうな気持ちになってもらったところで、まずはいったん日本語からはなれます。アルファベットです。コンピュータは英語圏で生まれたものですし、アルファベットは文字数が日本語に比べるとはるかに少ないのでまずはアルファベットを扱うものから見ていきます。で、アルファベットを対象にしたルールがあれば表現できそうですよね?このルールと今まで読んでいたものは正式には「文字コード」と呼びます。それではアルファベットを対象にした文字コードを見てみましょう。 アルファベットを対象にした文字コードで一番有名で広く使われているものはASCIIコードです。ASCII文字セット(ASCIIコードで使われる文字のセット)は128文字で構成されています。印字可能文字は94文字で残りの34文字は空白文字と制御文字(タブ、エスケープ、SI等の制御に必要なもの)です。以下、印字可能94文字の一覧と文字コードを示します。 {{image 0, ‘ASCIIコード’}} 背景色が青になっている部分が印字可能な94文字になっています。とりあえずこの背景色が青になっているところだけに中目して見てください。つまり今までと同じようなルールの書き方でいうと以下のようになっているのです。 ルール0:8ビット=1文字 ルール1:01100001に対応する文字として「a」を設定する ルール2:01100010に対応する文字として「b」を設定する ルール3:01100011に対応する文字として「c」を設定する (以下省略) aを定義しているのはルール1ではないだろうという突っ込みもあるかと思いますが、そこはご容赦下さい・・・。今まで考えてきたことと同じように考えを拡張することで対応可能だということが理解してもらえたのではないかと思います。 英語圏でのみ暮らしている人はとりあえす文字コードに関してはASCIIコードのみを知っていればおそらく生活できてしまうのだと思います。かなりうらやましいですね・・・。とりあえずその1はここまで。もしかしたら続くかもしれません。
{{amazon ‘B000NWDXLS’}} WiiFit買いました。本気でやって嫁に負けるゲームが登場。スキー。これは負けないように練習しなくては(笑)。
今週は毎日4時間睡眠程度で過ごしているのでものすごく朝起きるのがつらくなってきました。今日ももう2時30分。本当は勉強したいことが沢山あるんだけど、さすがに眠たくて頭が働かないので今日はあきらめます。くやしいです。
今日は朝から人身事故の影響で2時間30分。日中に1時間かけて移動。帰りも人身事故の影響で1時間30分。今日1日で合計5時間も移動してました。 ちくしょう。
昨日、仕事の上での話しとはいえ女性を泣かせてしまいました。反省。ごめんなさい。
確定申告の時期ですが自分でやっている余裕がなく、嫁ががんばってくれています。感謝。
{{amazon ‘4797336617’}} 完全に電車の中のみで「たのしいRuby」を読み終えました。つまり、手は動かせていないと言うことです・・・。(涙 サンプルも動かさずに読むだけよんでもだめだとは思いますが、それでも、やっと28歳にしてプログラミングの入門書であれば内容(とりあえず書いてあること)がきちんと1冊分理解できるようになったようです。今まではわからないことが多かったものなぁ。。。 プログラミング経験は小学生低学年くらいからBASICをはじめたはずなので、20年くらいですかね。20年かかってやっと入門レベルですね・・・。情けないけど。
今週は毎日2時間かけて客先へ出社し、途中で1時間かけて本社へ移動。食事時間もまともにとれないままミーティングを連発してます。 これだけ忙しいと自分の裁量でうんぬんできないんだから、「裁量労働制」なのはおかしいレベルですね。 マックの店長みたいなことにしようか・・・。
仕事の関係で文字コード(とくにUnicode)まわりを学んでいます。今まで良くわからずにいじってきたことを痛感。
仕事関連でみせてもらったソース。開いて見たら開始から423行かけてグローバル変数が宣言されていました。 なんというか、もう、本当にこういうのがあるんだなぁ・・・と。(大汗 これをみて、大学時代に友人に教えてもらったサイトを思い出して検索して見たらまだありました。 Cプログラミング診断室 (コ)の業界のオキテ 大学のころと違い、他人事ではないところが恐ろしいです。
よこすかウインドアンサンブル - 今後の演奏会情報(演奏会詳細) 寒い中自転車をこいで森のホール21でよこすかウインドアンサンブルのウインターコンサートを聴いてきました。 前回聞きに行ったときは親子鑑賞席に行ったのですが、今回は初めから2階席に。1部は娘も楽しんでパーカッションのまねをしたり、指揮者のまねをしていたりしました。結構複雑なリズムなのに、きちんと合わせられてたのでびっくり。 だんだん慣れてきて、2部以降は大きな声を出すようになってしまったので、嫁だけのこして退散して、公園で遊んできました。 前回に引き続きかなり楽しませてもらったので、ちょっとだけカンパして帰ってきました。また半年後のコンサートにも行こう。
{{amazon ‘4532149851’}}「社長!それは「法律」問題です」という本を読んでいたら、名誉毀損に関する解説が。該当部分を引用。 公 然 と 事 実 を 指 摘 し て 人 の 名 誉 を 棄 損 し た も の は 、 そ の 事 実 の 有 無 に か か わ ら ず 三 年 間 の 懲 役 ま た は 五 千 万 円 以 下 の 罰 金 」 だ か ら 、 事 実 の 有 無 に か か わ ら ず と い う こ と は 、 た と え ば 秋 山 さ ん が 賄 賂 を や っ て い る よ と い う の で 、 そ れ が 本 当 だ っ た と し て も 名 誉 棄 損 で は あ る の で す _事実の有無にかかわらず_というのは知りませんでした。かなりショックです。私は事実を事実として言って何がいけないのかわかりません。 ...
今日は嫁の用事で松戸に。お昼に印度亭にいってきました。 インド料理、インドカレーの『印度亭』 ランチビュッフェが1000円で値段的には標準的かもしれないけれども、味がおいしくて幸せでした。 で、さらに、ほとんど宣伝していないようですが、3歳以下の子供は無料でした。甘いカレーを注文すると4歳〜小学生と同じように500円なのですが、注文しなくても、ナンと、比較的辛くないカレーと、サラダと、スープと・・・と、色々あるので問題なかったです。 普通にお勧めできますが、普通の食事を食べられる2歳〜3歳くらいの子供がいる人には特にお勧めです。