特許とその制度について　特許出願および実用新案登録出願

特許知的財産データ開発エンジニア

お久しぶりです。主に特許関連のデータ処理を担当しているBTと申します。前回、特許及び実用新案の概要についてご説明させて頂きましたが、今回は日本国内における「特許出願」および「実用新案登録出願」についてご説明いたします。宜しくお願いいたしま…

2016-11-17

【資料公開】Cloudera World Tokyo 2016 で登壇しました。

データ開発エンジニア

こんにちは。アスタミューゼ開発・インフラ部の福田です。 11月8日に開催された Cloudera World Tokyo 2016 にて登壇させていただきました。こちらが、当日の資料になります。セッションについて『HBaseで実現する大量の特許文書データを扱うためのアー…

2016-11-02

Cloudera World Tokyo 2016登壇します！！

Hadoop HBase Cloudera データ開発エンジニア

こんにちは。福田です。来る11月8日（火）、Cloudera World Tokyo 2016にて、午後のブレイクアウトセッションに登壇します。『HBaseで実現する大量の特許文書データを扱うためのアーキテクチャとベストプラクティス』と題しまして、イノベーションを支える…

2016-11-02

Apache UIMA ちょっと触ってみる

テキスト処理 Java 自然言語処理データ開発エンジニア

こんにちは、データ周りを担当してる朴です。本日はJavaで自然言語処理をする為のオープンソースであるApache UIMA（ういま？）をちょっと触ってみたいと思います。 Apache UIMAはIBMが誇る人工知能システムであるWatsonの内部解析エンジンの一部のコード？…

2016-10-26

もう待てない、Spark2.0の導入と実践

Spark YARN Hadoop データ開発エンジニア

こんにちは、福田です。すっかり秋らしくなり、過ごしやすくなりました。皆様いかがお過ごしでしょうか。前回は、コンパクトで高速な大規模キーワード辞書の実装について書きました。今回は、先月末（9/29)にリリースされたCDH向けのSpark2.0 β版のセット…

2016-10-19

特許の「牽制」情報から、自社技術を活かした新たなテーマを探す方法

企画ブレスト特許データ開発エンジニア

はじめまして、さかいです。このたび、第2回ゲストとして、namikawaさん、波多野さんからご指名いただきました。このお二人からのご指名とあっては断るわけにはいきませんので、ありがたく、機会を頂戴いたしました。私は、アスタミューゼ株式会社のテクノ…

2016-09-21

Embulk について

Big Data データ開発エンジニア

山縣です。前回はSpark について書きましたが今回は最近良く使うようになっているEmbulk について書きたいと思います。 Embulkとは？ Embulk はオープンソースのバルクローダーです。あるデータストアから別のデータストアにデータを転送するためのツールで…

2016-09-14

特許とその制度について　特許・実用新案

特許知的財産データ開発エンジニア

お久しぶりです。主に特許関連のデータ処理を担当しているBTと申します。前回、知的財産権の概要についてご説明させて頂きましたが、今回は特許と実用新案の概要についてご説明いたします。宜しくお願いいたします。特許とは発明および特許になる発明と…

2016-07-26

HadoopのWordCountを天気予報のデータに適用してみよう！

Hadoop データ開発エンジニア

自己紹介こんにちは、astamuseでデータエンジニアをやってる朴と申します。 astamuse入社３年目になります。最初の１年間はweb開発エンジニアをやってましたが、もともとデータを色々いじるのが好きだったので、上司と相談して１年前から現在の仕事をさせ…

2016-07-21

1,100万文書×480万キーワード。コンパクト且つ高速な辞書マッチングのはなし

Hadoop Spark HBase Java Scala Python YARN テキスト処理データ開発エンジニア

はじめまして。開発・インフラ部、福田です。分散処理環境、ミドルウェアの整備と運用、ELT/ETL、R&D、雑用を担当しています。舞台裏から眺めるAstamuse.com Astamuse.comは、イノベーションを起こすあなたの為のサイトです。そこでは国内約1,100万件の特…

2016-07-05

Spark の driver で起きたエラーとその対応

Spark Scala データ開発エンジニア

はじめまして山縣です。私のチームでは弊社のサービスやコンサルティングなどで必要となる特許やその他さまざまなデータを収集・解析しています。特許情報などのデータはデータサイズとして大規模であったり複雑だったりすることもあり Hadoop なども含めた…

2016-06-30

特許とその制度について　特許権を含む知的財産権とは

特許知的財産データ開発エンジニア

主に特許関連のデータ処理を担当しているBTと申します。今回初めて開発者ブログを担当させていただく事になりました。宜しくお願いいたします。弊社が運営するのAstamuse.comでは、特許情報の検索や表示をすることが出来ます。そこで、開発言語の話やフ…

astamuse Lab

astamuse Labとは、アスタミューゼのエンジニアとデザイナーのブログです。アスタミューゼの事業・サービスを支えている知識と舞台裏の今を発信しています。

特許とその制度について　特許出願および実用新案登録出願

【資料公開】Cloudera World Tokyo 2016 で登壇しました。

Cloudera World Tokyo 2016登壇します！！

Apache UIMA ちょっと触ってみる

もう待てない、Spark2.0の導入と実践

特許の「牽制」情報から、自社技術を活かした新たなテーマを探す方法

Embulk について

特許とその制度について　特許・実用新案

HadoopのWordCountを天気予報のデータに適用してみよう！

1,100万文書×480万キーワード。コンパクト且つ高速な辞書マッチングのはなし

Spark の driver で起きたエラーとその対応

特許とその制度について　特許権を含む知的財産権とは