astamuse Lab

astamuse Labとは、アスタミューゼのエンジニアとデザイナーのブログです。アスタミューゼの事業・サービスを支えている知識と舞台裏の今を発信しています。

ニューラル機械翻訳モデルを自作してみる

こんにちは、師走ですね。業務に関連した技術トピックをということで、今回は翻訳について書こうと思います。 ニューラル機械翻訳(NMT)システムがその内側でどんな処理をしているかを理解することを目的に、実際に簡単な翻訳モデルを手元で作成してみて、…

社内Podcastはじめました〜文字起こし〜形態素解析

ご挨拶 どうもお久しぶりです、gucciです。 入社してついに3年目に突入しました。信じられません。 まだまだ力不足な私ですが、周りの人に支えられてなんとかここまでやって参りました。 新しい仲間もどんどんと増え、これからは支える立場になれるように日…

CoreNLP を使ってみる(1)

山縣です。 今回は 自然言語処理ツールである Stanford CoreNLPについて書きたいと思います。 Stanford CoreNLPとは Stanford CoreNLP は自然言語処理ツールのひとつです。スタンフォード大学がオープンソース(GPL3) で公開しています。 英語、中国語など主…

英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。

こんにちは。白木(@YojiShiraki)です。デザイナーです。 今日はPythonで英文形態素解析をする上でお手軽便利なpolyglotについて紹介します。 背景 当社ではデータを分析・解析する機会がままありまして、こうしたときに自然言語解析の処理のツールを利用し…

デザイン採用担当はポートフォリオで何を見ているか、何が見えているか?

初めまして、こんにちは。白木と申します。デザイナーです。 前回、「広告費用を自動取得し100時間分の作業をなくす話 - astamuse Lab」を投稿した後、「白木さんはデザイナーですか?」という趣旨のツッコミを複数からいただきました。その節は大変ありがと…

Apache UIMA ちょっと触ってみる

こんにちは、データ周りを担当してる朴です。 本日はJavaで自然言語処理をする為のオープンソースであるApache UIMA(ういま?)をちょっと触ってみたいと思います。 Apache UIMAはIBMが誇る人工知能システムであるWatsonの内部解析エンジンの一部のコード?…

1,100万文書×480万キーワード。コンパクト且つ高速な辞書マッチングのはなし

はじめまして。開発・インフラ部、福田です。 分散処理環境、ミドルウェアの整備と運用、ELT/ETL、R&D、雑用を担当しています。 舞台裏から眺めるAstamuse.com Astamuse.comは、イノベーションを起こすあなたの為のサイトです。そこでは国内約1,100万件の特…

Copyright © astamuse company, ltd. all rights reserved.