巨人の肩の上に登る

先人の積み重ねた発見に基づいて、なにかを発見しようとすることを指す。

PythonでN-gram

大学の課題で出たので,簡易に実装してみた. N-gramとは 自然言語処理の素性として良く使われる数量. 1-gram(uni-gram)だと,単語の頻度.2-gram(bi-gram)だと連続する二つの単語の出現頻度,3-gram(tri-gram)だと連続する三つの単語の出現頻度である. We…

ACM-ICPCアジア地区予選@会津に行って来た.

7月に行われたACM-ICPC2013国内予選を勝ち進み,アジア地区予選に参加してきました. 訳あって,オープン参加となりましたが,充実した3日間を過ごせました. 1日目 今年の会場は会津大学. 夜行バスと電車で,奈良-京都-郡山(福島)-会津・若松まで移動.…

次世代の”英文を理解する方法”を提供するサービス『Grasphy』

App

Mashup Awards 9 で,FinalStageに進出 !! Students賞, 株式会社ハートレイルズ賞を受賞しました.ありがとうございます. 追記:TechCrunchさんに取り上げられました. Grasphy とは Grasphyは,英語での情報収集を効率的に行うことを目的として開発された…

R を用いた相関係数と無相関検定

無相関検定 帰無仮説を「両変数間に相関がない」とする. p値が p < 0.01, あるいは,p < 0.05 であれば,帰無仮説が棄却され,「両変数間に相関がないとはいえない」となる. Rでの例 サンプルデータとして,下記の data.tsv を用いる. 下記のデータの一列…

遺伝的アルゴリズムをやってみた

遺伝的アルゴリズムを Cython で実装してみたGithub. 遺伝的アルゴリズムとは ざっくりと説明すると, 初期値として,N個の個体を無作為に生成する 評価関数を用いて,上位のM個の個体を選ぶ(エリート主義) 一定の確率に従い,交差や突然変異を行い,N個…

Scala でパーセプトロン

久しぶりにScalaを使うことになったので,練習がてらに Scala でパーセプトロンを書いてみた. 二次元データを対象とし,シンプルに実装してみた.(GitHubで公開) テスト 今回は Scalatest のFlatSpecを使ってみた. sbt 環境での使い方は,公式のUsing Sc…

目黒に行って来たのだが...

今日は日帰りで東京に行って来た. 15:00 からの予定だったのですが,2時間程早く到着.せっかくなので,ぶらぶらすることに. 特に行きたいとこもなかったので,本屋に行くことにしました. ところで,Google Mapには,周辺検索という機能があります.今年…

Redis 入門

Redis 使うことになったので,基礎的事項を最速でマスターできるようにまとめてみる. Redis とは Redisは,Key-Value型のNoSQLです. また,In Memory であるため,データ容量に対する制限はあるものの非常に高速に動作します. どのくらい早いのかという b…

Gitポケットリファレンス

Git の知識を増やそうと,"Gitポケットリファレンス"を買ってきた. ざっと,一通り読んだので感想. 内容 三部構成で,Gitの使い方,リファレンス,活用(AlMinium, Gitolite, .git/hooksなどなど). Gitのコマンドごとに簡易な Errrorの説明や解決策など…

Linux カーネル「概要」

OS関連の知識が欲しくて「LINUXカーネル」を読み始めたのだが,900ページ強もあり,中々続かない. その上内容をすぐ忘れてしまい,何回も同じところを読んでいるので,今回は忘れないようにまとめておく. 本書は20章構成で,第一章は概要である. 報知的…

Python で Stanford Parser を用いた構文解析

【13/10/05】 追記 relwellさんのforkのが良さそう. multi-threade で,安定してる気がする. Stanford のページに,多言語のラッパーが記載されています. 基本的に,Github のREADME通りで問題ないのですが,一応メモ. Stanford Parser の Python ラッパ…

インターンシップに行ってきた

NAISTの夏休みも残り 1/4 となりました.開始から先週まで,インターンシップに参加してきました.最初の一ヶ月は,mixiさんに,間を空けてCOOKPADさんに一週間行ってきました. mixi オフィスは,渋谷のファーストタワーというところにある綺麗なビルです.…

DSIRNLP に行って来た

9月1日(日)に DSIRNLP に行ってきました. 会場は,VOYAGE GROUPさんのオフィスで,2度目の訪問でした. DSIRNLP は,Data Structure, Information Retrieval, Natural Language Processing の頭文字らしいです. 今回は第4回目で,アジェンダはこんな…

Shuf

ファイルから N 行ランダムに取得するコマンド. 次のような txt ファイルがあるとする. # hoge.txt apple remon grape banana orange こんな感じで使える. shuf -n 2 hoge.txt apple orange Mac OS X に homebrew でインストールする方法. coreutils に…

技術ベンチャー論 ビジネスプランコンテスト

Naistの講義には「技術ベンチャー論」というものがある. 内容としては,二ヶ月間チームでビジネスプランを企画して,発表するというモノです. 今週の金曜に最終発表のプレゼンテーションがあり,無事優勝!. 発表されたアイデアは.クラウドソーシング,…

不格好経営

先日抽選で,DeNA創業者の南場智子さんの「不格好経営」が当たりました. テスト期間が終了してから読もうと思っていたのですが,非常に読み易く結局テスト期間中に読んでしまいました. 基本としてはDeNAの創業から現在までの物語で, 若干,南場さんの生い…

Yコンビネーター シリコンバレ ー最強のスタートアップ養成スクールー

Hatena Blog に乗り替えて,書評を書くのは初めてです. 大学院の図書館で借りた,「Yコンビネーター シリコンバレー最強のスタートアップ養成スクール」についての感想です. この本は,Yコンビネーターの約一学分の期間を著者が取材したドキュメンタリー形…

Julia

Julia とはどんな言語か We want a language that’s open source, with a liberal license. We want the speed of C with the dynamism of Ruby. We want a language that’s homoiconic, with true macros like Lisp, but with obvious, familiar mathematic…

Prolog 入門

久しぶりのブログです. Django + GAE で苦戦しまくてった今日この頃. その話はまた別の機会に記録しておきたい. 今日は,Prolog (PROgramming in LOGic) に挑戦してみました. 15分ほどしか触ってないのでたいした情報はありません. 主に,下記の3点に…

Pythonにおける配列生成の速度比較

序論|配列生成における生成速度 n 個の x からなるベクトル,あるいは,連続する整数 x | 0, 1 .... , n に対して、f(x) の値から配列を生成したいというケースが多々発生する. このとき,内包表記,map関数,などどういう手法をとればよいのかを検討して…

Pythonにおける2重ループとitertoolsの速度比較

バブルソート 今回はバブルソートを用いて比較を行った. まず,バブルソートのアルゴリズムを以下に示す. リストの先頭から順に n 番目と n+1 番目の要素を比較する. 要素の順序が逆であれば,入れ替える. この操作をデータ数 - 1 回繰り返す. 最悪計算…

Python でワンライナー

Python でワンライナーをやってみる. c オプションを用いて,テキストを渡すことで実行できる. $python -c "print 'Hello World'" $Hello World 今回は,以下のようなテキストファイルから数値を取り出し, その数値を2倍する処理を実装することを試みま…

Python Docstring の書き方

Python では,関数のはじめに docstring を3重クオートを用いて記述する. いつも,引数・戻り値などの書き方を悩むのですが,良さそうなものがあったのでメモ. Dive Into Python 3 からの引用 def approximate_size(size, a_kilobyte_is_1024_bytes=True)…

挿入ソート

単純なソートアルゴリズム. 計算量は O(n2). 空リストは整列されているものとする 整列しているリストに対して,1つの要素を正しい場所に挿入する insert :: Ord a => a -> [a] -> [a] insert x [ ] = [x] insert x (y:ys) | x <= y = x : y : ys | other…

マージソート

ボトムアップの分割統治法を用いたソートアルゴリズム. データを分割する 各々をソートする マージする 以下 haskell の実装(安定ソートではない) merge :: Ord a => [a] -> [a] -> [a] merge [ ] [ ] = [ ] merge xs [ ] = xs merge [ ] ys = ys merge (…

chrome extension を作ってみた

前から興味があったので,chrome extension を作ってみた. まずはドットインストールを,斜め見る.dotinstall 後は,リファレンスを読めば何とかなる. 公式リファレンス Stack 出来上がった,chrome extension は,"Stack". いわゆる,「後で読む」系の…

ユークリッドの互除法

ユークリッドの互除法は,2つの自然数または整数の最大公約数(Greatest Common Divisor)を求めるアルゴリズムです. 入力を m, n (m ≧ n) とする。 n = 0 なら、 m を出力してアルゴリズムを終了する。 m を n で割った余りを新たに n とし、更に 元のnを…

R を用いた t 検定

2組の平均値の差の検定です. 手順 正規性の検定(KS)を行う.正規性が認められるなら2へ.そうでなければ5へ. 等分散性の検定(F)を行う.母分散が等しいなら3へ.そうでなければ4へ. t検定を行う. Welch検定を行う. Wilcoxonの順位和検定を行う. それ…

視線移動の予測ツールを作ってみた

現在,視線移動予測の研究をしてるんですが,応用の1例として,インターフェースやデザインの視線分析というものを開発しています. 提案しているモデルでは計算量が大きすぎるので,α版として,ベーシックな顕著性マップを web tool 化してみました. (最…

Django

Django のチュートリアルを試してみた. Django ドキュメント1.4(和訳) Django の名前の由来は,Django Reinhardt というベルギーのギタリストだそうです. 有名な「開発のプロが教える標準Django完全解説」の表紙の人みたいですね. チュートリアル通りや…