お電話でのお問い合わせ

03-3589-6753

【エンジニアブログ】第47回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

イノベーション事業部の茶々丸です。

今回の第47回では当ブログでも度々話題になっているGoogleが提供する生成系AIのGemini(旧Bard)について紹介します。


ここ数年の間に画像生成AIという単語をよく耳にするようになりました。

ChatGPTには有料プランにはなりますが、DALL-EというOpenAI社からリリースされた画像生成AIを用いて画像生成を行うことができます。


一方Geminiでは現在無料で誰でも画像生成を行うことができます。


・画像生成方法
生成方法としてはいたってシンプルでGeminiの下部にあるプロンプト(指示)にテキストを入力するのみですが、現状ではいくつか条件があります。

①プロンプト(指示)の内容は英語で行う
②アスペクト比の指定はできない
③現在のバージョンでは人物を画像生成することはできない

今回は例として、以下の内容でGeminiに指示をしてみました(是非実際にお試しください)

Please generate an image of a Gundam standing in Shinjuku, Tokyo.
(東京の新宿に立つガンダムの画像を生成してください)

Could you please change the time of day in the generated image to night?
(生成した画像ですが時刻を夜に変更していただけますか?)

Could you please make the generated image face off against a Zaku?
(生成した画像ですがザクと対峙させていただけませんか?)

と、最初に生成された画像から対話形式でさらに変更を加えていくことも可能です。
ですが実際に生成して頂いた画像を見てもらえばわかりますが、ガンダムなどの具体的なものほど「それっぽい何か」が生み出されているかと思います。これは今後に期待ですね。


ですが抽象的なもの、たとえば

Generate an image of the sunset on the coast
(海岸に沈む夕日の画像を生成してください)

と、指示を送ることでまるで写真のような画像を生成してくれます。
対話形式で自分のお好みの画像を生み出せるようにGeminiを調整していくのも楽しいかもしれませんね。

それでは次回をお楽しみに!

【エンジニアブログ】第46回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

システム開発部の月月です。

今回は前回の『かこって検索』に引き続き、Googleの新たな検索機能をご紹介いたします。

今回紹介するのは『マルチ検索』です。


こちらの機能、iPhoneやAndroid上で利用可能なGoogleアプリに搭載されています。

Googleアプリには元々Googleレンズという画像検索機能が存在していましたが、画像+テキストを同時にインプットして検索できるようになりました。
これが『マルチ検索』です。
幅広い環境で使える機能ということで私も試しに使ってみましたので、使用例をお伝えします。


《使用例》
画像のインプットには、その場で撮った写真やカメラロールの写真を使用することができます。

今回はカメラロールにあった浅草寺の門の写真を使います(あの大きな提灯が特徴の門です)。

まずは画像のみで検索してみます。
すると、あの門の名前は宝蔵門ということが分かりました。Googleビジネスプロフィールや浅草寺のホームページなど、施設そのものの情報が上位の検索結果となりました。

続いて、画像+テキストで検索してみます。
先ほどと同じ画像に『グルメ』というテキストを追加して検索してみると、浅草のグルメ情報を扱うページが上位に表示されるようになりました。
日本語にもしっかり対応していますね。

このように宝蔵門や浅草寺の名前を知らなくても、写真があれば付近のお店を調べることが可能です。

他にも、折り紙の完成品の写真と『折り方』で検索すれば折り方を紹介しているページにすぐ辿り着くことができたり、様々な活用法が考えられますね。


第44回でご紹介した内容とも通じていますが、マルチモーダルAI(複数のデータタイプに対応して処理可能なAI)の進化が、私達の手の届く範囲にまで影響を及ぼしています。

新技術も習うより慣れろということで、ぜひ皆さんもお手元のスマートフォンでマルチ検索を試してみてはいかがでしょうか。

【エンジニアブログ】第45回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

イノベーション事業部の茶々丸です。

今回第45回では1月末より一部のGoogle Pixelなどで利用できるようになりました機能『かこって検索』についてご紹介させて頂きます。


昨今、X(旧Twitter)・Line・Facebook・Instagram・YouTube・TikTock等々、日々の生活でSNSを利用しない日がないほどSNSは一般的になってきたかと思います。
そんな折、SNS利用時に画像内や動画内で何気なく見かけた洋服や鞄、食べ物など、ふと目にしたモノの詳細を知りたくなったことはないでしょうか?


「かこって検索」はアプリを切り替えることなく、それらを簡単な操作でGoogle検索できる機能となります。

・起動方法
ホームボタンまたはナビゲーションバーを長押しすることで起動されます。

・操作方法
操作方法はいたってシンプルで、画像や動画を見ている際でもかこって検索は起動することができ、ディスプレイ内の検索したいモノを指でなぞって丸で囲むだけ。
すると、Google検索でその部分に関する情報が画像検索されます。検索結果には、画像や動画の該当部分の拡大表示や、関連するニュース記事やウェブサイトのリンクが表示されます。

また指でなぞって丸で囲む以外にも、検索したい部分をなぞって塗りつぶしたり、タップしたりすることでも検索は可能です。

と、ここまで紹介してきましたが、Google Pixelでないと使えないのでは…?という感想を抱かれると思います。
しかしご存じでしょうか?同じくGoogle Pixelで使用できる有名な「消しゴムマジック」ですが、
現在では有料サービスである「Google One」に加入すれば、iPhoneや他社のAndroid端末でも使えるようになっているのです。

ですので、かこって検索が将来的にGoogle Pixel以外の他端末で使用できるようになる日もそう遠くない未来にあることでしょう。


それでは次回をお楽しみに!

【エンジニアブログ】第44回 Enjoy&Engineer

画像に alt 属性が指定されていません。ファイル名: system-img-1024x217.png
Enjoy&Engineer

システム開発部の月月です。

今回は昨年12月に米Googleが発表した『Gemini(ジェミナイ)』についてご紹介します。


Geminiは最先端のマルチモーダル生成AIを謳っています。
マルチモーダル生成AIとは、テキスト、画像、音声、動画、コードなど、複数のデータタイプに対応し、それらを組み合わせて処理する能力を持った生成AIです。
従来の生成AIの多くは画像やテキストなど単一のデータタイプを扱うのが一般的でしたが、複数のデータタイプを扱うことでより複雑なタスクに対応することができます。


○Geminiの特徴
Gemini(ジェミナイ)の特徴は、以下の3つです。

・洗練された推論能力
大量のデータの中で判別が難しい情報を抜き取るなど、複雑なテキストや資格情報を理解する能力に長けています。

・マルチモーダル性
先述の通り、テキスト、画像、音声などを同時に理解することができます。
数学や物理学などの複雑な内容であっても、細かいニュアンスを読み取る能力が高くなっているそうです。

・コーディング能力
Python、Java、C++、Goなどのプログラミング言語でコードの説明や理解、生成が可能となっています。
生成するコードは従来のAIより高性能となっていることがベンチマークテストで示されています。

例として以下のような用途が期待されています。
・テキストと画像を組み合わせて、映画やアニメのストーリーボードを作成
・音声とテキストを組み合わせて、会話型AIの回答を生成
・画像とコードを組み合わせて、新しいソフトウェアをデザイン

『Gemini(ジェミナイ)』はGoogle BirdやPixel 8 Proなどに搭載され、それらを通じて活用することができます。


今後もGeminiの進化とそれがもたらす社会の変化に注目が集まりますね。

それでは次回をお楽しみに!

Mediaメディア掲載実績

歯科医院経営・総合情報誌アポロニア21/月刊「BIGLIFE21」/月刊「美楽」/楽天コミュニケーションズ㈱様/他

【Biglife21】様WEB記事はこちら
お客様の本音を集める新クラウドサービス「JOYボイス」を提案する

WEB記事を読む

Contactシステム開発・クラウドサービス・SES お気軽にお問い合わせください