Google技術講演会に行ってきた

Posted by
ぴろり
Posted at
2007/02/06 22:54
Trackbacks
関連記事 (0)
Comments
コメント (1)
Post Comment
コメントできます
Category
書斎

 先日2月2日,渋谷セルリアンホテルで行なわれた 技術講演会を聴講してきました。 Japan でエンジニアをされている3名の方から夫々興味深いお話しを聞くことができました。 講演の後は気さくな軽食パーティもあって, Japanの社員の方々ととても充実した時間を過ごせました。

この記事をはてなブックマークに追加する この記事のはてなブックマーク数 | この記事をlivedoorクリップに追加する この記事のlivedoorクリップ数 | この記事をYahooブックマークに追加する この記事のYahoo!ブックマーク数 | この記事をdel.icio.usに追加する

 講演を聴きながら残したの転記です。 今から見ると散文的な単語列でしかありませんが何かの参考になれば (誤解,曲解している部分が多々あると思うので他の関連記事とも整合してください)

講演

engineering philosophy
- Access to enormous computing resources and data
- Free access to all information
- Flat organzation
- Learn from each other
- Users first

講演 - 南野 朋之さん

エンジニア
開発について
- どういう
- プロダクトのローンチまで
デモ作成→社員の声→チーム増員→ Lab.→ユーザの声→正式
チーム=エンジニア4‾5名+プロダクトマネージャ1名+ユーザサポート1名
OKR; Objectives and Key Results
四半期ごとに人,チーム,会社などの様々なレベルで目標の設定と評価を行なう
まずデモを作ってみる…様々なフィードバックをもらえる
DesignDoc:開発の目的,実装の方法や手段,QAの方法などをきっちりドキュメントとして作成しを行なう(もちろん英語で!)
何のために作るのか,その背景,目的,テスト技法,実装方法はどうするのか,など。
のデータベース。社員であれば誰でも世界中から閲覧できる。
全てのはチーム毎ではなく全員で共有している。リポジトリは一つ!
の全ての
GFS:ペタバイト級のストレージに保存されている
クロールしたデータなどにもアクセス可能。自分で作ったデモで自由に使える。
みんなで作る…エンジニアチームは世界で一つ
Weekly Snippets:自分が今週は何をするのか共有

講演 - デリック トングさん

英語でスピーチ。半分くらいしかわからんかった(´・ω・`)
GMailの初期開発メンバー
使用シーンを再定義する
フォルダ分けのような細々した管理作業を必要としない
conversation model
integration with chat
Storage:Regular backup,
Search:15billion x 4kb = 56TBytes, by <20,000users
Anti Spam: traffic analysis, structure analysis
Current Homework:スレッド化されたをどうやってわかりやすく見せるのか?
Chat: persistent connect - Lingr みたいなの?, integration
Future:Storage fault torretrant

講演 - 工藤 拓さん

MeCabの人。
Search Quality の向上やspell Correctionなど。
インフラ整備は重要な
BigTable :のDBコア。
商用DBじゃない理由:
- 扱うデータ量が多すぎて使えない
- low-level storage optimization ができない
(row, column, timestamp) -> value
multi-dimensional, row sorted sparse
分散の最小単位をtabletsと言う
幾つかのcolumnの単位=Locality Groupとして扱う
圧縮アルゴリズムやブロックサイズ,アルゴリズムなど,扱うデータの特性に合わせて変更している。
データの保存先:GFS
- StoreData
- CommitLogs(on memory)
Chubby:分散ロック
どのrow,columnに何のデータがあるのか?
独自DNSっぽい仕組み
実装はC++
1. Chubbyをopen -> query
2. tablets serverに対してwrite/read
リ上の操作GFScommitLog
SSTable immutable,しかし操作はmutable,B-Treeで実装
1.write時:write bufferに書き込み→一杯になったらGFSにフラッシュ
2.read時:write bufferを走査→なかったらGFSに問合せ
2006年8月時点でサーバ24000台,60PJ以上
最大のtablet=800TB,10Billion Logs,数千台
秒間100万オペレーション,数GB/s Read/Write

Q&Aコーナ

Q. DBアクセスにはみたいなのは使わない。具体的にどうやって?
A. C++ライブラリを使って直接アクセス。BigTableに関する論文にちょっとしたコードが載っている。

Q. プロダクトマネージャとエンジニアの違いは?
A. コンピュータサイエンスの経験者。複数PJを掛持ち,チーム間の調整など。

Q. について公開中止になったり有料になったりする?
A. のアクセス数で制限しています。今のままで。

Q. 社員による機密の流出対策は?
A. 入社時にNDAを締結。基本的に個人の責任。

懇親会?20:15-

会場でOgawa::Memoranda小川さんを目撃してお話しさせて頂きました。
参加者に名札が配られたんですが,たまたま記憶にある名前が目に入ったので(笑
Tabletの分割について工藤さんを直撃
Q. 私:新しいサーバを用意してDBをミラーリングするみたいなイメージ。Tablet分割→どうやってミラーが一瞬で終わるんだろう?
A. 工藤さん:TabletもB-Treeで実装されていてツリーが新しく分かれる感じ。 GFS上のデータの物理的な配置が変化するとかじゃなくって,それをポイントしているインデックスが分離する。 だからミラーリングとかそもそもない。
…プリミティブで,かつが提供するに最も合う形でデータハンドリングのためのレイヤが組まれている感じ。 実際に組めるかどうかは別として,言われてみればこの設計は私の頭でも理解できた。 そしてそれが各種に綺麗にマッチしているのが凄いんだと思う。

雑記

TabletsやGFSについては論文と当日のプレゼンでほぼ同じ概念図が使われていたから,復習のためにも時間をとって絶対に読む。てかその前に英語を(ry
お土産にノベルティグッズを貰いました
・Tシャツ...黒地に R&D のプリント。人によって柄が違う。
Earth のホログラフ帳。面白い。
ロゴ入りボールペン
光るピンバッジ
更に軽食もついて無料。楽しかったなぁ。定期的に開催されてるようなので次も是非参加したい!


この記事を読んだ人はこんな記事も読んでいます ?

その他の関連する記事


関連記事/トラックバック

関連記事/トラックバックはまだありません

この記事のトラックバック URL

寄せられたコメント (最新 5 件を表示しています)

Posted by
ぴろり ◆OLEEi.VOX.
at
2007/02/08 13:24
ID
TBUwMZTg

コメントを投稿する

 (必須/公開)
 (必須/非公開)
 

コメントスパム防止のため投稿前に ランダムな数字 ? を入力してから投稿してください。 お手数ですがご協力のほど宜しくお願いいたします。(必須)