<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ぱわふるでいず</title>
	<atom:link href="http://pawa.dojikko.com/feed" rel="self" type="application/rss+xml" />
	<link>http://pawa.dojikko.com</link>
	<description></description>
	<lastBuildDate>Sat, 19 May 2012 00:50:20 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<image>
  <link>http://pawa.dojikko.com</link>
  <url>http://pawa.dojikko.com/wp-content/themes/pawa/images/favicon.ico</url>
  <title>ぱわふるでいず</title>
</image>
		<item>
		<title>超リアル模試600問 TEST3</title>
		<link>http://pawa.dojikko.com/study/toeic/2809.html</link>
		<comments>http://pawa.dojikko.com/study/toeic/2809.html#comments</comments>
		<pubDate>Fri, 18 May 2012 15:35:54 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[TOEIC]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2809</guid>
		<description><![CDATA[Part1:9/10 Part2:24/30 Part3:15/30 Part4:19/30 Part5:30/40 Part6:10/12 Part7:26/48（21/28, 5/20（塗り絵）） L：67/100, [...]]]></description>
			<content:encoded><![CDATA[<p>Part1:9/10<br />
Part2:24/30<br />
Part3:15/30<br />
Part4:19/30<br />
Part5:30/40<br />
Part6:10/12<br />
Part7:26/48（21/28, 5/20（塗り絵））</p>
<p>L：67/100, R:66/100</p>
<p>予想スコア：705（L:370, R:335）</p>
<p>７００点前半で限界を感じてきた。F(E?)ランク大学生の限界なのか！？</p>
<p>前回の反省から少々精度が悪くなっても良いからとにかくスピード最優先にしたけど、またしてもRで２０問塗り絵になってしまいました。</p>
<p>記録によると、目標はPart5~Par7は順に18分、6分、51分に対して実際にかかった時間は23分、9分、43分。Part7も43分で28問というのは時間かかり過ぎですな。</p>
<p>リスニングに関してはPart3はせめて６割は欲しい。<br />
リーディングに関しては本当に速読だけで４００点<span style="text-decoration: line-through;">超える</span>（390ぐらいで超えてませんでした）正答率なのですが、最後まで解ききるのが難し過ぎる。</p>
<p>あと残っている問題集は公式問題集 Vol.4のTEST2のみ、一度ぐらいは時間内に解き切らないと本番ではまず間に合わないでしょうね。</p>
<p>復習・・・していくか。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/study/toeic/2809.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lingua::JA::WebIDF</title>
		<link>http://pawa.dojikko.com/pg/perl/2806.html</link>
		<comments>http://pawa.dojikko.com/pg/perl/2806.html#comments</comments>
		<pubDate>Mon, 14 May 2012 13:24:58 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[Perl]]></category>
		<category><![CDATA[自然言語処理]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2806</guid>
		<description><![CDATA[CPANにうｐしました。（ようやく３作目のモジュール） 機能はWebIDFという珍しい単語なら高いスコア、ありふれた単語なら低いスコアになるものを計算・蓄積してくれます。 （詳しくいうと蓄積するのはDFだけですが。） 「 [...]]]></description>
			<content:encoded><![CDATA[<p>CPANにうｐしました。（ようやく３作目のモジュール）</p>
<p>機能はWebIDFという珍しい単語なら高いスコア、ありふれた単語なら低いスコアになるものを計算・蓄積してくれます。<br />
（詳しくいうと蓄積するのはDFだけですが。）</p>
<p>「Lingua::JA::TFIDF」というものが既にあるけど、</p>
<ul>
<li>Tokyo Cabinet を使いたい</li>
<li>DFの有効期限を設定したい</li>
<li>Bing APIを使いたい</li>
<li>速度にも少しこだわりたい</li>
<li>形態素解析器に依存しないものが欲しい</li>
</ul>
<p>などなどの理由で作りました。</p>
<p>これ単体でできることは限られています。一番メジャアッー！な使い方はTF・WebIDFですね。</p>
<p>例えば、Wikipediaの「しあわせソウのオコジョさん」のページから特徴語を得るプログラムは↓のようなコードでできます。</p>
<pre class="brush: perl; title: ; notranslate">
#!/usr/bin/env perl

use strict;
use warnings;
use utf8;
use feature qw/say/;
use Encode  qw/encode_utf8 decode_utf8/;
use Furl::HTTP;
use Text::MeCab;
use URI::Escape qw/uri_escape/;
use HTML::ExtractContent;
use Lingua::JA::WebIDF;
use open IO =&gt; qw/:utf8 :std/;

my $furl      = Furl::HTTP-&gt;new;
my $extractor = HTML::ExtractContent-&gt;new;
my $mecab     = Text::MeCab-&gt;new;

my $webidf = Lingua::JA::WebIDF-&gt;new(
    api      =&gt; 'Bing',
    appid    =&gt; '********************',
    fetch_df =&gt; 1,
    driver   =&gt; 'TokyoCabinet',
    df_file  =&gt; './bing_utf8.tch',
);

my $base_url = 'http://ja.wikipedia.org/wiki/';
my $word     = 'しあわせソウのオコジョさん';

tfidf( $base_url . uri_escape( encode_utf8($word) ) );

exit;

sub tfidf
{
    my $url = shift;

    my $html = $furl-&gt;get($url);
    my $text = $extractor-&gt;extract($html)-&gt;as_text;

    my (%tf, %tfidf);

    for (my $node = $mecab-&gt;parse($text); $node; $node = $node-&gt;next)
    {
        my ($pos) = split( /,/, decode_utf8($node-&gt;feature) );

        if ($pos eq '名詞')
        {
            my $surface = decode_utf8($node-&gt;surface);

            # filter
            next if length $surface &lt; 2;
            next if $surface !~ /\p{InJapanese}/;
            next if grep { $surface eq $_ } qw/こと 編集/;

            $tf{$surface}++;
        }
    }

    for my $word (keys %tf)
    {
        $tfidf{$word} = $tf{$word} * $webidf-&gt;idf($word);
    }

    my $count = 0;

    for my $word (sort { $tfidf{$b} &lt;=&gt; $tfidf{$a} } keys %tfidf)
    {
        say &quot;$word: $tfidf{$word}&quot;;
        last if ++$count == 20;
    }
}

sub InJapanese
{
    return &lt;&lt;END;
+utf8::InHiragana
+utf8::InKatakana
+utf8::Han
END
}
</pre>
<p>特徴語上位２０件↓</p>
<pre class="brush: plain; title: ; notranslate">
コジョピー: 386.171531614208
オコジョ: 292.897525423041
槌谷: 281.884974913032
原作: 179.976069757367
コジョルー: 160.411346098222
オコジョさん: 133.798285738485
オコジョ番長: 129.681687518929
アニメ: 96.6414628733992
佐伯: 75.9954845670898
名前: 63.48325666071
メカオコジョ: 60.9936712475112
シュン: 60.8748835396027
塚原: 49.8910554936603
鮭延未可: 49.0996710307705
上田陽司: 47.4318328536311
宇野亜由美: 47.2854623611228
谷井あすか: 44.8573438828622
ピャンキー: 43.7254002402696
編曲: 42.9811819937835
作詞: 40.4270538749535
</pre>
<p>「Storable」と「TokyoCabinet」ではどっちが速いんやろ？と思いましたが、DFの量が多くなるとTokyoCabinetのほうが速いですね。<br />
ただ、Storableは初回読み込み時がしんどいだけで一旦読み込んでしまえば恐らくTokyoCabinetより速いと思います。</p>
<p>データ消失はTokyoCabinetのほうが可能性が低いと思います。</p>
<p>UTF8フラグはついててもついてなくても動きますが、Storableの場合はどっちかに統一しないと別々のデータとして保存されて無駄に容量消費します。</p>
<p>余裕があれば「Lingua::JA::TFWebIDF」みたいなのもうｐしたい。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/pg/perl/2806.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ちょいと(en&#124;de)codeのベンチマーク</title>
		<link>http://pawa.dojikko.com/pg/perl/2801.html</link>
		<comments>http://pawa.dojikko.com/pg/perl/2801.html#comments</comments>
		<pubDate>Thu, 10 May 2012 15:47:26 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[Perl]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2801</guid>
		<description><![CDATA[decode_utf8 ＜ find_encoding_decode_utf8 なのに encode_utf8 ＞ find_encoding_encode_utf8 なのが意外です。 perl -v ↓ This is [...]]]></description>
			<content:encoded><![CDATA[<pre class="brush: perl; title: ; notranslate">
#!/usr/bin/env perl

use strict;
use warnings;
use utf8;
use Benchmark qw/cmpthese timethese/;
use Encode    qw/encode_utf8 decode_utf8/;

my $utf8flaged   = 'オコジョさん';
my $utf8unflaged = encode_utf8(&quot;ちょろり&quot;);

my $encoder = Encode::find_encoding('utf-8');

cmpthese(
    timethese(-1, {
        'encode_utf8' =&gt; sub {
            encode_utf8($utf8flaged);
        },
        'find_encoding_encode_utf8' =&gt; sub {
            $encoder-&gt;encode($utf8flaged);
        },
        'decode_utf8' =&gt; sub {
            decode_utf8($utf8unflaged);
        },
        'find_encoding_decode_utf8' =&gt; sub {
            $encoder-&gt;decode($utf8unflaged);
        },
    })
);
</pre>
<pre class="brush: plain; title: ; notranslate">
Benchmark: running decode_utf8, encode_utf8, find_encoding_decode_utf8, find_encoding_encode_utf8 for at least 1 CPU seconds...
decode_utf8:  1 wallclock secs ( 1.21 usr +  0.00 sys =  1.21 CPU) @ 129249.59/s (n=156392)
encode_utf8:  1 wallclock secs ( 1.28 usr +  0.00 sys =  1.28 CPU) @ 1535999.22/s (n=1966079)
find_encoding_decode_utf8:  1 wallclock secs ( 1.10 usr +  0.00 sys =  1.10 CPU) @ 450560.00/s (n=495616)
find_encoding_encode_utf8:  2 wallclock secs ( 1.06 usr +  0.00 sys =  1.06 CPU) @ 1185710.38/s (n=1256853)
                               Rate decode_utf8 find_encoding_decode_utf8 find_encoding_encode_utf8 encode_utf8
decode_utf8                129250/s          --                      -71%                      -89%        -92%
find_encoding_decode_utf8  450560/s        249%                        --                      -62%        -71%
find_encoding_encode_utf8 1185710/s        817%                      163%                        --        -23%
encode_utf8               1535999/s       1088%                      241%                       30%          --
</pre>
<p>decode_utf8 ＜ find_encoding_decode_utf8 なのに<br />
encode_utf8 ＞ find_encoding_encode_utf8 なのが意外です。</p>
<p>perl -v ↓<br />
This is perl 5, version 12, subversion 3 (v5.12.3) built for x86_64-linux</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/pg/perl/2801.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>平成野球息子。（ナウい息子）</title>
		<link>http://pawa.dojikko.com/yakyu/kusa/2798.html</link>
		<comments>http://pawa.dojikko.com/yakyu/kusa/2798.html#comments</comments>
		<pubDate>Sat, 05 May 2012 12:18:02 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[草野球]]></category>
		<category><![CDATA[野球]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2798</guid>
		<description><![CDATA[アルバイトの面談、一箇所敬語間違ったけど無事に終わりました。簡単な試験もあって面白かった。 まだ派遣なので本当に仕事紹介してもらえるまではドキドキタイムです。 こっちが「本当に仕事もらえるんかい？」と思っているのと同様に [...]]]></description>
			<content:encoded><![CDATA[<p>アルバイトの面談、一箇所敬語間違ったけど無事に終わりました。簡単な試験もあって面白かった。<br />
まだ派遣なので本当に仕事紹介してもらえるまではドキドキタイムです。<br />
こっちが「本当に仕事もらえるんかい？」と思っているのと同様に、相手も「こやつ本当に仕事してくれる（できる）んか？」と考えているのでしょうか。<br />
時給は良いので紹介された仕事を全部バッチシこなして信頼関係築いて、まずは院試費用の獲得を目指すです。</p>
<p>さて、今日は金属の棒♂を持って草野球でした。</p>
<p>自分は２番レフト。</p>
<p>１打席目：無死ランナー１塁。バント空振りでヒッティングに切り替えるもアウトコースの玉に興奮してアッー！（見逃し三振）</p>
<p>２打席目：２死ランナー３塁。高めのカーブに止めようとしたバットがあたって投前ゴキヒット（１打点）。その後、２球の牽制玉投げられて興奮して２盗。</p>
<p>３打席目：１死ランナーなし。内外角に投げ分けられつつも２ストライク３ボールまで粘る。しかし、アウトコースの臭い玉をカットしようと思って空振り三振。</p>
<p>調子は最悪でしたが、「見逃し三振」「投安」「空振り三振」１打点１盗塁 .333 で最低限の結果は出したという感じ。</p>
<p>そこまで足が速いわけでもないけど、高校野球でヘッドスライディング恐怖症を完全克服しているのでリードでかなり稼いでいます。</p>
<p>守備は４回機会があって、「レフトオーバー」「レフト定位置よりややセンターよりの左飛」「レフト定位置よりやや後方の左飛」「ファールフライ（スライディングキャッチを試みたが、はじく）」でエラーはなかったけどファールフライは捕りたかった。</p>
<p>本職はセカンドなのでレフトの良い練習になりました。</p>
<p>試合は負けてしまいました。試合とバントを決めれるバッターになりたい。<br />
バントはある程度は定期的に練習していないと難しいですね。<br />
屋内スポーツみたいな細々した動きは苦手なので１番バッターが好きです。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/yakyu/kusa/2798.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>超リアル模試600問 TEST2</title>
		<link>http://pawa.dojikko.com/study/toeic/2796.html</link>
		<comments>http://pawa.dojikko.com/study/toeic/2796.html#comments</comments>
		<pubDate>Tue, 01 May 2012 15:41:34 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[TOEIC]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2796</guid>
		<description><![CDATA[「Lingua::JA::WebIDF」というのを書いてるけど、テストプログラムで慣れていない「Plack」を使い出したら意外と時間かかってしまって一日では書けませんでした。「Lingua::JA::TFIDF」というの [...]]]></description>
			<content:encoded><![CDATA[<p>「Lingua::JA::WebIDF」というのを書いてるけど、テストプログラムで慣れていない「Plack」を使い出したら意外と時間かかってしまって一日では書けませんでした。「Lingua::JA::TFIDF」というのがCPANに既にあるけど、IDFはTF・IDF以外にも使えるのでIDFを計算する機能を別のもう少し便利で高速なCPANモジュールとして切り離すことを計画しています。</p>
<p>さて、今日はいつも通り、「英単語の復習」→「公式問題集などの復習」という流れでした。<br />
夕方からは「超リアル模試600問 TEST2」をやりました。</p>
<p>結果は<br />
Part1:7/10<br />
Part2:23/30<br />
Part3:18/30<br />
Part4:16/30<br />
Part5:30/40<br />
Part6:9/12<br />
Part7:30/48</p>
<p>L:64/100　（予想スコア：355）<br />
R:69/100　（予想スコア：360）<br />
予想スコア：715</p>
<p>でした。</p>
<p>Part1の6は手押し車っぽいのにゴミ袋が入ってるので「trash bin」は形状的におかしいやろと思ったけど、「trash bin」の文が正解。<br />
こんな手押し車っぽいのも「trash bin」なのかぁぁぁ！？と思った。</p>
<p>Part3とPar4はもうちょっと正解したかった。<br />
Part5の文法は本番よりは確実に難しいと感じたけど、なんとか１０問ミスに収まったという感じ。<br />
Part7は19問塗り絵にも関わらず、マークしたところが27/29正解で19問の塗り絵中3問的中で30/48という結果に。</p>
<p>時間さえあればRは予想スコア400狙える力はあると思うけど、スピードがどうにもなりません。(-_-;)</p>
<p>記録によると、Part5で23分、Part6で11分かかっていて、Pat7は41分で29問解いた計算。</p>
<p>目標は、Part5:20分 Part6:6分 Part7:49分 ぐらいか。</p>
<p>復習していきますかね。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/study/toeic/2796.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>派遣のアルバイト</title>
		<link>http://pawa.dojikko.com/note/2793.html</link>
		<comments>http://pawa.dojikko.com/note/2793.html#comments</comments>
		<pubDate>Sat, 28 Apr 2012 13:50:42 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[雑記]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2793</guid>
		<description><![CDATA[大学の成績はMAXに近いけど、今年は学会関係以外では大学から１円の援助もないので派遣のアルバイトに応募しました。 とにかく何するのにも金がない。大阪から東北まで研究室訪問するだけで院試の検定料が足りなくなるぐらい。 無線 [...]]]></description>
			<content:encoded><![CDATA[<p>大学の成績はMAXに近いけど、今年は学会関係以外では大学から１円の援助もないので派遣のアルバイトに応募しました。</p>
<p>とにかく何するのにも金がない。大阪から東北まで研究室訪問するだけで院試の検定料が足りなくなるぐらい。</p>
<p>無線のアクセスポイントを設置するという、やりがいがありそうな派遣のアルバイトが出ていたのでそれに応募しました。<br />
「ここのアクセスポイントはワシが設置した」とか言えるように頑張りますぜ！</p>
<p>履歴書とかそれに近いものいっぱい書いたり、派遣のアルバイトって実際どうなんよ？とか調べていたおかげでTOEICの勉強が進みません。</p>
<p>4月29日：超リアル模試600問 TEST1の復習の続き<br />
4月30日：Lingua::JA::WebIDF（仮） CPANにアップロード</p>
<p>ぐらいで４月を終えて</p>
<p>5月の初め：超リアル模試600問 TEST2,3<br />
5月中旬：TOEIC 公式問題集 Vol.4 TEST2<br />
5月中旬以降：総復習<br />
5月27日：第170回 TOEIC</p>
<p>という予定です。</p>
<p>院試受かったら長期のアルバイトで本格的に学費を稼がなければなりません。<br />
特別研究とかやる時間あるのやら。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/note/2793.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>765 Project</title>
		<link>http://pawa.dojikko.com/study/toeic/2791.html</link>
		<comments>http://pawa.dojikko.com/study/toeic/2791.html#comments</comments>
		<pubDate>Tue, 24 Apr 2012 00:57:59 +0000</pubDate>
		<dc:creator>pawa</dc:creator>
				<category><![CDATA[TOEIC]]></category>

		<guid isPermaLink="false">http://pawa.dojikko.com/?p=2791</guid>
		<description><![CDATA[TOEICで765（ナムコ）のキリ番取るのを目標にします。 L:370 R:395ぐらいで。 中学２年生から高校２年生まで精神的に追い込まれて教科書全部切断したり学校の備品を軟球で破壊したりしていましたが、英語まで捨てた [...]]]></description>
			<content:encoded><![CDATA[<p>TOEICで765（ナムコ）のキリ番取るのを目標にします。</p>
<p>L:370 R:395ぐらいで。</p>
<p>中学２年生から高校２年生まで精神的に追い込まれて教科書全部切断したり学校の備品を軟球で破壊したりしていましたが、英語まで捨てたら本格的に人生終わりそうだと思って少しぐらいは勉強していたのが助かりました。</p>
<p>「超リアル模試600問」のTEST1をやったけど、L:65/100 R:64/100 で予想スコアは L:360 R:330 T:690 でした。</p>
<p>またしてもRが最後20問塗り絵。分からない単語も少なくなってきたけど相変わらずスピードが出ない。<br />
明らかに選択肢に悩まされすぎです。</p>
<p>「超リアル模試600問」のTEST1は今のTOEICより若干難しい程度なのでもっと点数取れないと厳しいですな。</p>
]]></content:encoded>
			<wfw:commentRss>http://pawa.dojikko.com/study/toeic/2791.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

