読者です 読者をやめる 読者になる 読者になる

学記の旋律

自分が学んだこと、考えたこと、思ったことをダンプするブログ。自分が理解したかは他人に説明して初めてわかる精神のもと怠惰に学びを記す。

Airの英語版を聞きながら勉強するpart1

f:id:sinnloss:20170127023859j:plain

ナレーション

My child, heed my words. The story I’m about to tell you is a very important one. It entails a long, long journey, undertaken by the parent and passed on to the child, continuing from generation to generation without end.

heed

  • 傾聴する

heed my words = よくお聞きなさい

entail

  • 伴う
  • 影響を及ぼす

f:id:sinnloss:20170127024012j:plain

国崎往人

I’m absolutely starving right now, and I would like nothing more than to have some delicious ramen in my belly.

|お兄さんは今、猛烈に腹が減っている
|ラーメンセットが是が非でも食いたいんだ

なるほど「是が非でも食いたい」を would like nothing more than … in my belly と表す

f:id:sinnloss:20170127024521j:plain

子供

What’s with that filthy little doll!

filthy

  • 汚い
  • 不潔

|なんだこれきったねえ人形

しばしばWhat’s withが出て来る 普通にWhat’s that filthy little doll!でも 通じそうだがwithを入れて 「〜はどうしたんだ」という意味にしている

子供

Don’t it do anything else?

|なんか他にできないの?

子供

I’m sorry, but that puppet is totally nasty!

nasty

  • 汚い
  • 不潔

f:id:sinnloss:20170127024708j:plain

神尾観鈴

You all by yourself? Hot today, isn’t it?

|お一人ですか
|暑いですね

You all by yourself?でお一人ですか? 特に動詞があるわけでもないし口語表現っぽい

f:id:sinnloss:20170127024752j:plain

国崎往人

What is she after? Money? Hmph, I don’t have any money.

after

  • 〜を求めて

|なんだ何が目的だ?金か?
|金ならないぞ

f:id:sinnloss:20170127024828j:plain

神尾観鈴

Here you go.

|(ジュースというか固形物を渡しながら)はい

国崎往人

Have a nice trip?

|ご苦労だったな

良い旅だったか?みたいな意味で取りそうだけど こういう意味があるんか。それとも慣用的な言葉?

f:id:sinnloss:20170127024911j:plain

神尾観鈴

Why would you go and do something like that?

|どうしてそういうことするかな……

国崎往人

Tryna make a fool of me!?

Tryna

  • Trying to

Trynaなんていう言葉はないがwannaのように 慣用表現として通じる

神尾観鈴

Why would I be mean to you?

|そんなことないですよ

どうして私がそんなひどいことすると思うんですか (いやそんなわけないでしょ)的な英語ならではの表現

f:id:sinnloss:20170127025020j:plain

神尾観鈴

I poked you a couple of times to try to wake you up, but it didn’t look like you were going to any time soon…

poke

  • 突っつく

|起こそうと思って突っついたりしてたんだけど
|全然起きる様子がなくて……

国崎往人

I think I owe you one.

ああ、お前のおかげだ

f:id:sinnloss:20170127025118j:plain

国崎往人

How come you’ve been hanging around me all day?

|さっきからなんで俺にまとわりつく!

How come はWhyと同じ意味だがその後の語順が平叙文になる How come のほうがなんとなく使う際に楽かな

f:id:sinnloss:20170127025225j:plain

神尾観鈴

Oh, well… mine’s Misuzu Kamio.

|私、神尾観鈴

mine'sは初めて聞いたがまあわかる

国崎往人

What would your mother say if she knew you asked me that?

|第一、母親が許さないだろ

これ英語の場合直訳すると あんた(観鈴)が俺(往人)にそう(泊まってくれと)頼んだことを 母親(晴子)が知ったらなんていうんだ? っていうわかりづらい表現な気がする 文脈に合うようにいろいろ言語によって変わってんなあ

[家にて] f:id:sinnloss:20170127025340j:plain

神尾観鈴

She wouldn’t care. My mother’s really hands-off, so she wouldn’t say anything. I guess I shouldn’t really be talking about my mom like that. …But really, it’s totally okay if you stay here.

hands-off

  • 干渉しない

|お母さんすごくだらしない人だから問題ないと思う
|って自分の親をそんなふうに言うもんじゃないか
|でもほんと泊まっても大丈夫

英語版だと (彼女は)気にしないよ お母さんは干渉しないから何も言わないと思う

f:id:sinnloss:20170127025451j:plain

神尾晴子

I’m tired of telling you to stop making that noise.

|その口癖やめって言うてるやろ

神尾晴子

You’re kinda old to be in school with her, aren’t you?

kinda

  • kind of の砕けた表現

|はあ?えらい年くっとるやないか?

f:id:sinnloss:20170127025534j:plain

神尾晴子

Okay, it seems like you’ve got some self-confidence, and I can kind of admire you for that.

|まあ、肝は座っとるようやし?そのへんは嫌いやないわ

英語版だと 肝が座っている=自信があるように見える そのへんは嫌いやないわ=そのへんは尊敬できるわ

神尾晴子

Hey Freeloader, how come you’re looking so down in the mouth, huh? I want you to join in the fun with me, okay?

Freeloader

  • 居候

|おい居候、何湿気た顔しとるんや?
|あんたもなんかしたらんかい

神尾晴子

Where is the showmanship, huh?

showmanship

  • エンターテイナーとしてのサービス精神

|センス無いわー

神尾晴子

Oh come on, so you’re a hack, there’s no shame in that, is there? Sit back down, have another drink.

あっはははは、別にそんな才能のうてもええやん 飲んで忘れよっ、飲んで

 神尾晴子

I’ve got a pretty good eye when it comes to men and I don’t think I’d mind it one bit if you stuck around for a little while.

|うち、こう見えても男を見る目はあるつもりや
|しばらくおいたってもええけど

stack around

  • 立ち往生する

ここでの意味的に 男に関しては見る目がある、だから少しの間いてもちっとも気にしない

f:id:sinnloss:20170127025652j:plain

神尾晴子

And if you can make her stop doing that roar thing, you know what I’m talking about, she goes “Gao.” She does it all the time, when she’s frustrated, or about to cry.

roar

  • 吠える

|あと、この子が口癖言うたときも直してくれへんかな
|「がおー」って言うやろ?困った時泣きそうなときに

f:id:sinnloss:20170127025804j:plain

神尾観鈴

I have to take remedial classes.

remedial

  • 補習の

|私実は補習

f:id:sinnloss:20170127025813j:plain

国崎往人

She wanted me to make sure you didn’t do anything dumb, or whatever.

anything dumb

  • (砕けた表現として)バカなこと

|お前が馬鹿な真似しでかさないように見張ってろって

f:id:sinnloss:20170127025852j:plain

神尾観鈴

I drew it so you can see where there’ll be a bunch of people. That should help you when you go to work today, right?

bunch

  • 束、群れ

|これで人が集まる場所とかわかるはず
|お仕事の参考になるよね

f:id:sinnloss:20170127030053j:plain

国崎往人

I’m in charge of a girl with severe brain damage.

|これがあいつの心の世界なのか

これ表現が英語のほうがひどくなってない? 俺は脳に重度の障害がある女の子を預かってしまった って言ってんだが

f:id:sinnloss:20170127030131j:plain

国崎往人

Like some crazy wish-granting puppy thing, where if I do something nice, you’ll give me a bunch of wishes.

wish-granting

  • 願いを叶える

|もしそうならおとぎ話みたいに恩を売ったら
|見返りを期待してもいいはずだな

f:id:sinnloss:20170127030159j:plain

霧島佳乃

You mean him? Potato isn’t a weird little alien, you sillyhead. He’s just our neighborhood stray puppy dog, that’s all.

sillyhead

  • お馬鹿さん(おそらくそんな意味)

stray

  • さまよう(野良の)

|これのこと?
|ポテトは地球外生物じゃないよ?
|うちの近所の野良犬くんだよ

sillyheadって辞書にもなかったから造語か?

f:id:sinnloss:20170127030308j:plain

国崎往人

Did you hurt your wrist or something?

wrist

  • 手首

霧島佳乃

Yeah! see, you’re like citizen number two on the intergalactic planet Dilly-Dally!

intergalactic

  • 銀河系の

Dilly-Dally

  • Dillyは素晴らしい人
  • Dallyはだらだらする

|よおし、君のことひまひま星人二号に任命するよ

f:id:sinnloss:20170127030344j:plain

国崎往人

I wonder if every girl who wears that uniform is a total wacko.

wacko

  • wackyの砕けた表現で「変な」

あの制服着てるやつは変なのばっかなのか?

f:id:sinnloss:20170127030430j:plain

国崎往人

No, I’m the innocent bystander that you just plowed into

bystander

  • 傍観者

plowed into

  • 耕す

|お前に突き飛ばされた善良な通行人だ

f:id:sinnloss:20170127031028j:plain

みちる

This guy’s just a pervert who likes kidnapping young girls for kicks.

kidnapping

  • 誘拐

for kicks

  • 刺激を求めて

|わかったー美凪、こいつみちる達をさらいに来た変態誘拐魔だよ

for kicksの意味は合ってんのか?わからん

みちる

Oh, so you’re not just a pervert kidnapper, you’re a homeless vagrant too?

vagrant

  • 浮浪者

|変態誘拐魔で宿無しとか救いようがないよね〜!

f:id:sinnloss:20170127030704j:plain

国崎往人

Did I do something wrong to that pipsqueak?

pipsqueak

  • ザコ

|俺、あのガキになんかしたか?

pipsqueakがザコって意味で笑った

f:id:sinnloss:20170127030731j:plain:w275 f:id:sinnloss:20170127030733j:plain:w275

神尾観鈴

I don’t know. I… I’ve always had this feeling like there’s another me up there. Isn’t that a romantic thought? That the real you is up in the sky. It must be amazing, you can see forever into the distance. Everything on the ground would look so insignificant. You’d probably feel very loving, or no, maybe not loving exactly, but gentle and calm.

insignificant

  • 無意味

|わかんない……ただ、
|もう一人の自分がそこにいる、そんな気がして
|それって、ロマンチックだよね?
|本当の自分が空にいるなんてすごく気持ちが良さそう
|遠くまで見渡せて、地上にいることなんて
|全部ちっぽけに見えて
|きっと、すごく優しい気持ちになれるんだよね……

『プロフェッショナルは「ストーリー」で伝える』第1章


『プロフェッショナルは「ストーリー」で伝える』という本がある。
主に経営者向け、とりわけ人心掌握や説得力のある人間になりたい

と願う人へ向けた本。

                                                 

https://images-na.ssl-images-amazon.com/images/I/41b3ie2DD2L._SX349_BO1,204,203,200_.jpg

 

 

ストーリーというのはどこの誰でも持っていて、日常的に使っている。
この、何気なく使っているこのストーリーが実はとんでもない力を持っているのだということがこの本を通して語られる。


今回のテーマは「信用」である。
信用を得るのにストーリーがとても手軽、かつ大きな役割を果たすという。

順番に見ていく。

 

人々は今以上に大量の情報など求めていない。

あまりに膨大な情報に、むしろうんざりしている。
人々が本当に求めているのは信用だ。

 

情報過多の社会に必要なのは膨大な客観的データによる信用ではない。
むしろ、その人がどういう人間かをみることで得られる主観的な信用がもっと重要。
そのためにストーリーが役立つという。

 

ストーリーはあなたに対する信用を生み出す手段だ。

人は押し付けられた結論より

自分自身でたどり着いた結論を重んじるものだ。

 

つまり、ストーリーによって結論を言うのではなく相手にその結論を導かせる。
これが信用を得る一番のコツであるという。


信用を得るために以下のようなことを言っても意味がない、むしろ逆効果である。
「私には100人の有名人との人脈があり、有名な大学出身、だから信用してください」
これが事実であるとしても信用は得られないという(当たり前)。


では、信用を得るにはどうすれば良いか。

それは信用に関する世論調査に隠されていた。

 

回答者たちは「直接知っている人」なら、

その85%ぐらいは自分に「フェアに振舞ってくれるだろう」
と考えた。

 

人は「あの人のことはよく知っている、だから信用できる」

と思う生き物という訳である。
そこで重要なのは、

自分の人間性を表しやすい物語を一つ語ることだということである。


退屈な人だと思われたくない場合は愉快なジョークがオチとなるストーリーを語る。
これで退屈という疑惑は払拭され、その人を直接知っているかのような感覚に陥らせ
信用を勝ち取ることができる。

 

まとめ:

今回のテーマは「信用」ということで、

人から信用を得ようと思ったら客観的なデータをいくら示そうと

無意味であるということ、
それよりも自分を直接的に表現しているストーリー1つ語ることで

自分と相手を簡単につなぐことができるからぜひ活用すべしということだった。

 

 

 

 

テキストファイル(UTF8)を一文字ずつ分割したかった話

今回は記事タイトル通り。


UTF-8エンコードされたテキストファイルを
一文字ずつ分割するプログラムを作成したかった話である。


ぶっちゃけそんなプログラムは簡単に書ける人が多いだろう。
特に記法がシンプルなスクリプト言語PythonPerlRubyなど)であれば
本当にちょろっとコードを書けば終了である。


しかし今回は事情が違った。
というのも、処理しなければならないテキストファイルが
6GBほどの量だったからだ。


PythonRubyのようなスクリプト言語を使用すると
膨大なテキストを流し込んだ時には速度が遅いため時間がかかってしまう。
そこで最終的に処理の速いC言語で実装することにした。

Pythonによるコード

ひとまず最初に作成したPythonによるソースコードを載せることにする。

# -*- coding: utf-8 -*-

import codecs
import sys

i = 0
fin = codecs.open('text8.txt', 'r', 'utf-8')
fout = codecs.open('output.txt','w','utf-8')

while True:
    i += 1
    c = fin.read(1)
    if (c==' ') : pass  
    elif (c=='\n') : fout.write("\n")        
    else : 
        fout.write(c)
        fout.write(" ")
    if (i%200000==0) :
    print(str(i)+"_clear")
    if not c:
    break


Pythonで書くとわりと簡単に作成できた。


このプログラムの機能はいたってシンプルである。
一文字ずつテキストを読み込んでスペースだったらスペース、改行であれば改行を出力先のテキストに書き込む。
文字であれば文字とスペースをテキストに書き込む。

20万文字読み込むたび途中経過を出力する。
これで一文字ずつ分割されたテキストファイルができる。


ただし実行してみたところ処理速度がいかんせん遅かった。
そこで、膨大な量のテキストを処理する場合はやはり処理の速いコンパイラ言語を使うのが適切だと思い、
C言語を使って同じ処理をするプログラムを書いてみた。

C言語によるコード

以下に示すのがC言語によるソースコード


gist6bfba928e6f972e62c2678bfc490f957

C言語でもPythonと同様にread(1)のようなものでできると思っていたのだが、
どうも最初うまくいかなかった。
というのもUTF-8は英語のアルファベットなどは1バイト、
日本語の漢字などは3バイトといった具合に
文字の種類によって一文字のバイトの単位が異なる。
その場合1バイトずつ読み込んでスペースを入れたのでは
日本語のワイド文字が分裂してしまう。


簡単に説明すると、
アルファベットや数字のようなASCIIであれば
abc = ○□△ のように表されているため(○□△はそれぞれ1バイト)
abc -> ○/□/△ ->a b c
このように分割できる


しかし日本語の漢字のようなものだと3バイトなどで一文字を構成しているため
日 = ○□△ という具合に表現されている。これを分割してしまうと
日 -> ○/□/△ -> ???
と文字化けしてしまう(バイナリファイルと化す)


そこで、その一文字が何バイトで構成されているかを最初に調べてから
どのタイミングでスペースを入れるのかを考慮することになったわけである。


ちなみにこのプログラムは
コマンドライン引数にテキストファイルを指定することに注意。
それと、読み込んだ文字数が大きすぎるとi++
最大値をオーバーするので1000万突破したらリセットしたりする方が良いかも。

締め

今回はプログラムをダンプすることになったわけだが
そもそもなぜ膨大なテキストファイルを一文字ずつ分割する必要が
あったのかといえば現在取り組んでいる研究が原因である。


ニューラルネットワークでよく利用されているWord2vecのような
単語埋め込み表現はWikipediaなどの膨大なテキストファイルを利用して
単語の特徴量を出力する。


Word2vecの場合名前の通り「Word=単語」レベルで特徴量を調べるが
今回取り組んだのは「文字」レベルでの特徴量の抽出である。


日本語の場合ひらがな、カタカナ、漢字と文字の種類が多く、
文字レベルで特徴量を調べても役に立つのではないだろうかと考えた。


こういう理由によってテキストファイルを一文字ずつ分割するプログラムが
必要になりネットで情報を探して自作することになった。終。

ここまで来た、どこへ行こう。

どうも、ここではsinnlossと名乗ることにする。

最初に言っておくと、この記事のタイトルに大した意味はない。

 

フランスの印象派の画家ポール・ゴーギャンの有名な作品

『われわれはどこから来たのか われわれは何者か われわれはどこへ行くのか』

から適当に考えて(パクって?)作ったタイトルからこのブログは始まっている。

0126-where_do_we_come_from.jpg

引用:『われわれはどこから来たのか われわれは何者か われわれはどこへ行くのか』

(1897年)ボストン美術館

Paul Gauguin, 1897 [Public domain], via Wikimedia Commons

 

 ポール・ゴーギャンをいきなり出すあたり

いかにも意識高い系な雰囲気を醸し出してそうだが

基本私はサボリ癖のあるグータラな人間であり意識の地ベタリアンである。

 

「大学生の夏休みを一日15時間モンスターハンターをして過ごした」

それぐらいの規模の意識の低さ。

なのでこのブログもいつ書くのをやめるのかわかったものじゃない。

 

しかしこのブログは自分の学んだことや自分の考えたこと、

思ったことを出力する、あるいはダンプするのが目的であり

他人に見てもらうのが趣旨ではない。

 

ただ、「他人が見ていてもおかしくない 」という精神で書くと

きちんとした理解のもとで説明しなければいけないと思えるため

案外学習したことを理解したかをチェックするには有効ではないかと考えている。

 

というわけでしばらくはブログの書き方を学びつつ

文章の書き方を改善させながら楽しむとしよう。

 

ちなみにこのブログのタイトル(記事ではなく全体のタイトル)は

「学記の旋律」というこれまた適当な思いつきによるもので大した意味はない。