2016年01月のNY 日本人IT技術者日記新着記事

NY 日本人IT技術者日記 http://neko32.blogspot.com/

NYでテクニカルアーキテクトとして黙々と働いてます．扱うテーマは技術ノート，英語・ＮＹに関すること等．

ＩＴに携わる一納税者．ただのたぬきかもしれない．趣味はジャズ，クラシック，プログラミング，ゲーム，猫，妻と一緒に街歩き．

圏外	総合ランキング
圏外	英語ブログ
圏外	ビジネス英語
圏外	海外生活ブログ
圏外	海外サラリーマン
圏外	IT技術ブログ
圏外	IT技術メモ

本日のランキング詳細

tanu32

フォロー

住所: アメリカ

出身: 北見市

ブログ村参加: 2013/04/05

参加テーマ

過去記事

Spark - StatsCounter

StatsCounterを使えば簡単に統計用の基本的な値を計算できる． import org.apache.spark.{SparkContext, SparkConf} /** * Created by neko32 on 2016/01/18. */ obje...
2016/01/18 16:06
Spark - パーティション単位でのマップ

PairRDDのpartitionBy()を使ってパーティション毎の要素の合計を計算をする例．入力ファイルは以下のようなキーバリューの対とする．また，バリューはスペース区切りの整数の列とする． lineA:73 44 58 62 lineAB:88 21 20 line...
2016/01/18 15:27
Scala - JSONの作成

以下の例はPlay frameworkのJSONライブラリを使ってJSONを作った例． Scalaの型から作られたJSONをJson.parse()を使ってまたJSON化もしている． import play.api.libs.json._ /** * Created ...
2016/01/15 15:46
Spark - JDBC経由でデータを取得

以下の例はSparkJDBCを使ってRDB(ここではMySQL. MySQLは使いやすくていいね！)からデータを取得しJDBCRDDを構築する． import java.sql.{ResultSet, DriverManager} import org.apache.sp...
2016/01/13 17:18
Spark - CSVファイルの書き込み

以下の例はRDDの内容(Neko case class)をCSVファイルとしてHDFSに書き込む例． package tanuneko import java.io.StringWriter import com.opencsv.CSVWriter import org...
2016/01/12 14:34
Spark - ファイル名をキー，内容をバリューとしてファイルを読み込み

SparkContextのwholeTextFiles()を使うと，ファイル名をキー，内容をバリューのRDDを作ることが出来る．以下の例では，HDFS上に空白区切りで数字が羅列されている複数のファイルを一括で読み込んでそれぞれの算術平均を求めている． val in = sc....
2016/01/11 13:47
Spark メモ - CSVからkey - non-key ペア変換

HDFS上のCSV風テキストを最終的に主キー - 非キー別タプルに変換する例． // read input file separated by comma // suppose this input file consists of 4 cols (tradeid, ve...
2016/01/07 14:06
scala - 外部コマンドの実行

Scalaの外部コマンド実行はJavaのProcessBuilderほぼ同じ. /** * Created by neko32 on 2016/01/03. */ object RunCommand { def main(args:Array[String]):Un...
2016/01/04 06:36
scala - CSVファイルの読み込み

CSVファイルを読み込んで多重配列に保存するコードのメモ.. import resource._ import scala.io.Source object CSVReadRunner extends CSVRead { def main(args:Array[St...
2016/01/04 05:19
scala - try with resource相当

Scalaにおいてtry-with-resourceのようなARMを使うには,私の知っている限りscala-ARMを使う必要がある．以下の例はmanagedを使ってwriterをmanagedを使って自動で閉じ，scala.io.Sourceで読みだした後，自前のcloseA...
2016/01/04 02:54
Scala - マップのキー・バリュー交換

scalaでは，mapのキー・バリュースワップを容易に実現出来る． val myMap = Map("Tora" -> "Chatora", "Mikeyo" -> "Mike", "Powder" -> "Mike") val reversed = fo...
2016/01/03 16:40
Scala - Sequenceマッチ

Scalaのmatch文は極めて強力で，そのうちの一つのリスト要素へのパターンマッチも便利なものの一つだろう．以下の例はMyCatへのコンストラクタマッチとリスト要素へのシーケンスパターンマッチの組み合わせの例．もしパターンマッチ内でジェネリック型も含めた型パターンマッチ等をして...
2016/01/01 07:00