astamuse Lab

astamuse Labとは、アスタミューゼのエンジニアとデザイナーのブログです。アスタミューゼの事業・サービスを支えている知識と舞台裏の今を発信しています。

データ分析

データクレンジングとかクォリティチェックとかの話

いつもご覧いただき誠にありがとうございます。 ご存知のとおり?弊社は世界最大級のイノベーションデータベースを保有しており、中にはクラウドファンディング、科研費データ、特許データなど様々なデータが含まれてます。 普段仕事上データを入手してから…

データドリブンな企業とは何か~アスタミューゼ流宴会術~

こんにちは 今回、開発・デザイン以外の部署からゲスト寄稿させていただくことになりました亀久です。 自己紹介の前に、まだこのブログではアスタミューゼの組織体制がどうなっているのかを明らかにしたことがなかったと思うので、そのあたり簡単にご説明し…

英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。

こんにちは。白木(@YojiShiraki)です。デザイナーです。 今日はPythonで英文形態素解析をする上でお手軽便利なpolyglotについて紹介します。 背景 当社ではデータを分析・解析する機会がままありまして、こうしたときに自然言語解析の処理のツールを利用し…

Apache Zeppelin と Spark2 on YARN の連携

こんにちは、データ周りを担当してる朴です。 今日はのデータ分析、可視化ツールで注目されているApache ZeppelinとSparkの連携およびZeppelinのマルチユーザー環境の設定について共有したいと思います。 簡単な紹介 簡単にApache zeppelinの紹介をしますと…

特異値分解と行列の低ランク近似

はじめまして。テクノロジーインテリジェンス部で主にデータ周りの業務を担当しているshmです。今回、並河さんからご指名を頂き、記事を執筆させて頂くことになりました。 さてデータといえば、最近では統計処理ソフトR、Pythonの数値計算ライブラリNumPyや…

Copyright © astamuse company, ltd. all rights reserved.