Hello World!

フェイクニュースから守ります!!!
はじめまして!TrendOwlです。バズっているツイートのRT状況からフェイクニュースである可能性がどれぐらいあるかを分析します。

SlideshowSlideshowSlideshowSlideshowSlideshow
SlideshowSlideshowSlideshowSlideshowSlideshow
SlideshowSlideshowSlideshowSlideshowSlideshow
SlideshowSlideshowSlideshowSlideshowSlideshow
SlideshowSlideshowSlideshowSlideshowSlideshow
SlideshowSlideshowSlideshowSlideshowSlideshow

Trend OWLは2021年にできたTwitterプラットフォーム上のファクトチェックサービスです。 我々のものは情報の伝播の仕方からフェイクニュースを見抜くアルゴリズムを使った世界でも数少ないサービスです。

これまでの分析

TrendOwl 【α版】🦉👀

@trend_owl

8Retweets

18Likes

TrendOwlは #cccu22 にてCode for Japan賞を受賞しました。

課題の探究からチームメンバーぞれぞれの役割分担、利用のしやすさなどの観点から表彰していただきました。
今後は精度の向上、透明性の追求を軸に幅広く展開していきたい次第です。
今後もぜひ応援よろしくお願いいたします!
#TrendOwl twitter.com/codeforjapan/s…

TrendOwl 【α版】🦉👀

@trend_owl

1Retweets

0Likes

RT @trend_owl: 【分析レポート】
こちらのツイートのフェイク率は80%と分析されました。
#TrendOwl
※現在テスト運用中です。数値が乱れる場合がございます。
※対象ツイートのRT状況とフェイクニュースの拡散モデルから推測しています。
https://t.…

TrendOwl 【α版】🦉👀

@trend_owl

0Retweets

0Likes

【分析レポート】
こちらのツイートのフェイク率は0%と分析されました。
#TrendOwl
※現在テスト運用中です。数値が乱れる場合がございます。
※対象ツイートのRT状況とフェイクニュースの拡散モデルから推測しています。
trendowl.sugokunaritai.dev/results/1245e8…
twitter.com/YahooNewsTopic…

Request

TrendOwlは、ツイートの分析リクエストを受け付けています。

→分析したいツイートのURL

About

いーちゃん

いーちゃん

キンジョウ

キンジョウ

ようかん

ようかん

とみっくす

とみっくす

しんぶんぶん

しんぶんぶん

Tyler

Tyler

Twitterでバズっているツイートに対して、RTの拡散状況とユーザーの属性から、その情報がフェイクニュースであるかどうか分析します。

拡散状況を可視化したり、みんなで気になるツイートを分析したりして、フェイクニュースを判断するものさしにしてもらいたいです。

ハッカソンで生まれ、まだまだ、【α版】での検証になります。どんどん精度を上げて、賢くなっていきます!

分析手法

データ収集

まず、ユーザーにツイートの分析リクエストを送信してもらい、リクエストされたツイート・リツイートをTwitterAPIを利用して取得します。次に、取得したデータから、ユーザーとツイートの特徴を抽出することで、データ収集を行います。このようなデータ収集の例として、ユーザー登録されてからツイートまでの経過時間,フォロー/フォロワー数が挙げられます。

機械学習

入力されたデータを固定長テンソルに変換し、RNN(LSTM), CNNを組み合わせたモデルによってフェイク度を算出しています。

グラフ生成

ツイート/リツイートしたユーザーのプロフィール画像を取得し、プロフィール画像を丸く切り抜き、ツイート/リツイートの前後関係を利用してグラフを描画しています。そして、グラフを背景画像に重ねています。

ツイート

グラフ画像をTwitterにアップロードして、分析結果をツイートしています。

機械学習モデルの選定

自然言語処理型と伝播モデル処理型を検討しました。

なぜ伝播モデルを採用したか?

Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks を読み、伝播モデルを利用すると早期検出もできることを発見しました。

次に、FNED: A Deep Network for Fake News Early Detection on Social Mediaは、PU-Learning採用やNLPの組み合わせなど様々な改善により5分間の検出精度90%を達成しています。そのためFNEDの実装をしようと試しましたが、当時の能力不足により断念しました。ひとまずPPCの実装に取り掛かりました。

なぜ自然言語処理型を採用しなかったのか?
Using NLP for Fact Checkingを読んだ時点で、自然言語処理によるフェイクニュースの検出は現実的ではないという判断をしました。

CCCについて

Civictech Challenge Cup(CCC) は一般社団法人コード・フォー・ジャパンが主催している、学生による、学生のためのシビックテック開発コンテストです。

コンテストにエントリーした学生がチームを組成し、自分たちの身近にある地域課題や解決したい社会課題を解決するアイディアを考え、実際にその解決に向けたサービスのプロトタイプを開発する実践的な開発コンテストです。

SGGについて

すごくなりたいがくせいぐるーぷ(SGG)は、2020年4月に発足した学生クリエイターコミュニティです。

メンバー同士で刺激を与え合うことにより技術力等を向上させることを目的としています。また、初心者でも気軽に 質問ができるような環境も整っており、

「プログラミング未経験だがプログラミングに少し興味がある」といった方でも 気軽に参加いただけます! もちろんデザイナーなどプログラマー以外でも大歓迎!

大人達が各技術コミュニティで知見を共有しているように、学生達もさまざまなイベントを開き、お互いが学び、 刺激をもらえるコミュニティを目指します。

中学生・高校生・大学生の若い世代でもお互いの持っている知見を惜しみなく共有しあうことで最強の人材がたくさん生まれるようになります。

プログラミングをしていて、「わからない!どうしよう!」となることがありますよね。1人で悩むこともいいですが、 SGGでは気軽にメンバーに相談することができます。また、SGGは日本各地にメンバーがいるので、全国の様々な特色を 持ったメンバーたちと繋がれます。

Link