お久しぶりです。主に特許関連のデータ処理を担当しているBTと申します。 前回、特許及び実用新案の概要についてご説明させて頂きましたが、今回は日本国内における「特許出願」および「実用新案登録出願」についてご説明いたします。 宜しくお願いいたしま…
こんにちは。アスタミューゼ開発・インフラ部の福田です。 11月8日に開催された Cloudera World Tokyo 2016 にて登壇させていただきました。 こちらが、当日の資料になります。 セッションについて 『HBaseで実現する大量の特許文書データを扱うためのアー…
こんにちは。福田です。 来る11月8日(火)、Cloudera World Tokyo 2016にて、午後のブレイクアウトセッションに登壇します。 『HBaseで実現する大量の特許文書データを扱うためのアーキテクチャとベストプラクティス』と題しまして、イノベーションを支える…
こんにちは、データ周りを担当してる朴です。 本日はJavaで自然言語処理をする為のオープンソースであるApache UIMA(ういま?)をちょっと触ってみたいと思います。 Apache UIMAはIBMが誇る人工知能システムであるWatsonの内部解析エンジンの一部のコード?…
こんにちは、福田です。 すっかり秋らしくなり、過ごしやすくなりました。皆様いかがお過ごしでしょうか。 前回は、コンパクトで高速な大規模キーワード辞書の実装について書きました。 今回は、先月末(9/29)にリリースされたCDH向けのSpark2.0 β版のセット…
はじめまして、さかいです。このたび、第2回ゲストとして、namikawaさん、波多野さんからご指名いただきました。このお二人からのご指名とあっては断るわけにはいきませんので、ありがたく、機会を頂戴いたしました。 私は、アスタミューゼ株式会社のテクノ…
山縣です。 前回はSpark について書きましたが今回は最近良く使うようになっているEmbulk について書きたいと思います。 Embulkとは? Embulk はオープンソースのバルクローダーです。あるデータストアから別のデータストアにデータを転送するためのツールで…
お久しぶりです。主に特許関連のデータ処理を担当しているBTと申します。 前回、知的財産権の概要についてご説明させて頂きましたが、今回は特許と実用新案の概要についてご説明いたします。 宜しくお願いいたします。 特許とは 発明および特許になる発明と…
自己紹介 こんにちは、astamuseでデータエンジニアをやってる朴と申します。 astamuse入社3年目になります。 最初の1年間はweb開発エンジニアをやってましたが、 もともとデータを色々いじるのが好きだったので、上司と相談して1年前から現在の仕事をさせ…
はじめまして。開発・インフラ部、福田です。 分散処理環境、ミドルウェアの整備と運用、ELT/ETL、R&D、雑用を担当しています。 舞台裏から眺めるAstamuse.com Astamuse.comは、イノベーションを起こすあなたの為のサイトです。そこでは国内約1,100万件の特…
はじめまして山縣です。 私のチームでは弊社のサービスやコンサルティングなどで必要となる特許やその他さまざまなデータを収集・解析しています。特許情報などのデータはデータサイズとして大規模であったり複雑だったりすることもあり Hadoop なども含めた…
主に特許関連のデータ処理を担当しているBTと申します。 今回初めて開発者ブログを担当させていただく事になりました。 宜しくお願いいたします。 弊社が運営するのAstamuse.comでは、特許情報の検索や表示をすることが出来ます。 そこで、開発言語の話やフ…