指定したTwitterアカウントの全ツイートを取得(暫定.NET版)

投稿日: 2012/01/11 作成者: masuda

以前、ツイートのクローラーを perl で作ってみたのですが、

指定したTwitterアカウントの全ツイートを取得(perl版) | Moonmile Solutions Blog
http://www.moonmile.net/blog/archives/860

この perl スクリプトは古い公式クライアントにしか対応していないので、現在のバージョンではクロールできません…ってな訳で、C# で作り直してみました。

通称「ツイートキャッチ ★★キュア」…★は各自考えるように、とか。

実行ファイルは、CrawlTwitter.0.1.zip をダウンロードしてください。ドキュメントとか一切ないけど、まぁ、暫定版ということで。
ソースコードのほうは、CrawlTwitter at master from moonmile/etc – GitHub にあります。

実行すると結構かかります。3000 ツイートで 15 分ぐらいなので、掛かり過ぎ。これは高速化する予定です。
「コピー」ボタンをクリックすると、グリッドの情報をクリップボードにコピーします。Excel などに貼りつけて使って下さい。

下にあるテキストボックスは、取得したドキュメントのソースですね。デバッグ用に表示しているので、コピーして使ってみてください。中身がわかります。

仕掛けとしては、「もっと見る」のボタン（アンカー）を javascript でクリックしています。C# から WebBrowser オブジェクト経由でクリックする場合は、下記のように

橋本商会 ≫ C#のWebBrowserコンポーネントからJavaScriptを実行
http://shokai.org/blog/archives/1234

ブックマーレットにするといいみたいです。詳しくは git のソースコードを見てください。

—
ちなみに、リンク先の質問に「逆にWebBrowserから情報を得られるのか？」という質問がありますが、ソースコードを見るとわかりますが、

1	`HtmlDocument doc = webBrowser1.Document;`

な形で、ブラウザの DOM が取得できます。これを使うと javascript から dom を使うのと同じように扱えます。なので、javascript 側から値を返す場合は、適当なタグを作っておいて、取り出した HtmlDocument オブジェクトから直接取り出せばいい（getelementbyidとか）のです。

カテゴリー: ツール, C# パーマリンク

指定したTwitterアカウントの全ツイートを取得(暫定.NET版) への4件のフィードバック

maru のコメント:

2012/08/26 12:10 pm

こんにちは。
メッセージボックスで以下のエラーが出て、ツイートの取得ができないのですが、どこをいじればよろしいでしょうか？
——————————————————————————
アプリケーションのコンポーネントで、ハンドルされていない例外が発生しました。[続行]をクリックすると、アプリケーションはこのエラーを無視し、続行しようとします。[終了]をクリックすると、アプリケーションは直ちに終了します。

値をNullにすることはできません。
パラメーター名:data
——————————————————————————
masuda のコメント:

2012/08/27 12:16 pm

暫定で作ったのでエラー処理をしてなくて、twitter.com の反応が鈍いと取得エラーになって、うまくいかないというのがあるんですよね。なので、「twitter.com」が空いている時間？がお勧めです。

「ツイートの取得」のエラーって、どんな条件でエラーがでますか？
最初の取得をしたときとか、取得をしている途中でエラーが出るとか、そんな風に伝えて頂けると対処しやすいかも。
maru のコメント:

2012/08/29 7:55 am

ご返信ありがとうございます。

アカウントを入力して[実行]を押して待っていても画面下にツイートが表示されないので、
[中断]や[コピー]を押したのですが、
[中断]や[コピー]を押すタイミングでメッセージボックスが現れ、上記のようなメッセージが表示されます。

ですので、ツイートを取得している最中のエラーになるのでしょうか？
- masuda のコメント:
  
  2012/08/29 3:18 pm
  
  1.「確認」ボタンで、アドレスが有効であることを確認
  　ブラウザに表示される。
  2.「実行」ボタンを押すと、クロール数のカウントがアップされるので、ひたすら待つ。
  3.「中断」「コピー」は押してはいけません。
  　「中断」自体は適当な実装だったかも。
  
  そうすると、クロール数が3000ぐらいでストップするはずです…なんですが、止まりませんね。画面の仕様が変わって動かなくなっているのかも。

コメントは停止中です。

検索:
2025年4月

日月火水木金土

1 2 3 4 5

6 7 8 9 10 11 12

13 14 15 16 17 18 19

20 21 22 23 24 25 26

27 28 29 30

« 2月
MVP Visual C++ 2011-
MVP ASP.NET/IIS 2012-
MVP Visual C# 2013, 2014
MVP Windows Development 2015-2023
■ ■ ■ ■
最近の投稿
最近のコメント
- 学童でプログラミング教室を開いた3年間の話に masuda より
- 学童でプログラミング教室を開いた3年間の話につっちんより
- Windows で Raspberry Pi のバックアップを取る方法に Raspberry Piでキオスク端末を | Nacky – Snowland.net より
- Microsoft OCR をデスクトップのWFPアプリで動かす方法に Office系ソフトでOCRしたい　より
- SQLite で LINQ を使うに C#でSQLite3を使ってみる | IT技術情報局より
- Xamarin.Forms でドラッグを実装しよう（Xamarin.Forms on Android編）に GITARAKULU より
- HDDのアクセススピードは VMWare に影響するのか？に SIREN より
- [win8] 画像加工をDirectXに任せて、UIはC#にする技に WindowsストアアプリでDirect2D描画のRGB値を得る方法を考えてみた。 « M-AE、山科駐在員のブログより
- [win8] metro アプリケーションからデスクトップアプリにプロセス間通信するに jun maeda より
- 必ず成功するための100の開発手順(メモ) に masuda より
menu
アーカイブ
- 2025年2月 (2)
- 2025年1月 (5)
- 2024年12月 (3)
- 2024年9月 (1)
- 2024年7月 (7)
- 2024年6月 (8)
- 2024年5月 (3)
- 2024年4月 (10)
- 2024年3月 (4)
- 2023年7月 (1)
- 2023年6月 (2)
- 2023年5月 (6)
- 2022年12月 (1)
- 2022年9月 (2)
- 2022年8月 (1)
- 2022年7月 (1)
- 2022年2月 (1)
- 2021年12月 (1)
- 2021年11月 (3)
- 2021年10月 (2)
- 2021年9月 (2)
- 2021年3月 (2)
- 2021年1月 (3)
- 2020年12月 (3)
- 2020年8月 (2)
- 2020年7月 (3)
- 2020年4月 (4)
- 2020年3月 (1)
- 2020年2月 (1)
- 2019年11月 (1)
- 2019年10月 (2)
- 2019年9月 (6)
- 2019年8月 (5)
- 2019年7月 (2)
- 2019年6月 (1)
- 2019年5月 (1)
- 2019年4月 (2)
- 2019年3月 (2)
- 2019年2月 (8)
- 2019年1月 (4)
- 2018年12月 (3)
- 2018年11月 (4)
- 2018年10月 (7)
- 2018年9月 (2)
- 2018年8月 (1)
- 2018年7月 (3)
- 2018年6月 (12)
- 2018年5月 (15)
- 2018年4月 (1)
- 2018年1月 (1)
- 2017年12月 (3)
- 2017年11月 (2)
- 2017年10月 (4)
- 2017年9月 (4)
- 2017年8月 (3)
- 2017年7月 (4)
- 2017年6月 (7)
- 2017年5月 (1)
- 2017年4月 (1)
- 2017年2月 (1)
- 2017年1月 (3)
- 2016年12月 (10)
- 2016年11月 (9)
- 2016年10月 (10)
- 2016年9月 (20)
- 2016年8月 (8)
- 2016年6月 (4)
- 2016年4月 (5)
- 2016年3月 (3)
- 2016年2月 (7)
- 2016年1月 (11)
- 2015年12月 (9)
- 2015年11月 (4)
- 2015年10月 (8)
- 2015年9月 (8)
- 2015年8月 (3)
- 2015年7月 (5)
- 2015年6月 (4)
- 2015年5月 (16)
- 2015年4月 (7)
- 2015年3月 (14)
- 2015年2月 (9)
- 2015年1月 (1)
- 2014年12月 (11)
- 2014年11月 (8)
- 2014年10月 (19)
- 2014年9月 (15)
- 2014年8月 (12)
- 2014年7月 (11)
- 2014年6月 (16)
- 2014年5月 (8)
- 2014年4月 (12)
- 2014年3月 (19)
- 2014年2月 (11)
- 2014年1月 (16)
- 2013年12月 (4)
- 2013年11月 (1)
- 2013年10月 (2)
- 2013年9月 (16)
- 2013年8月 (4)
- 2013年7月 (12)
- 2013年6月 (5)
- 2013年5月 (6)
- 2013年4月 (24)
- 2013年3月 (29)
- 2013年2月 (21)
- 2013年1月 (2)
- 2012年12月 (4)
- 2012年11月 (12)
- 2012年10月 (13)
- 2012年9月 (19)
- 2012年8月 (17)
- 2012年7月 (12)
- 2012年6月 (11)
- 2012年5月 (17)
- 2012年4月 (20)
- 2012年3月 (11)
- 2012年2月 (19)
- 2012年1月 (30)
- 2011年12月 (27)
- 2011年11月 (13)
- 2011年10月 (5)
- 2011年9月 (15)
- 2011年8月 (10)
- 2011年7月 (12)
- 2011年6月 (6)
- 2011年5月 (6)
- 2011年4月 (13)
- 2011年3月 (20)
- 2011年2月 (40)
- 2011年1月 (20)
- 2010年12月 (10)
- 2010年11月 (15)
- 2010年10月 (6)
- 2010年9月 (16)
- 2010年8月 (25)
- 2010年7月 (31)
- 2010年6月 (7)
- 2010年5月 (20)
- 2010年4月 (13)
- 2010年3月 (10)
- 2010年2月 (10)
- 2010年1月 (1)
- 2009年12月 (11)
- 2009年11月 (15)
- 2009年10月 (15)
- 2009年9月 (7)
- 2009年8月 (1)
- 2009年7月 (2)
- 2009年6月 (14)
- 2009年5月 (23)
- 2009年4月 (19)
カテゴリー
- 開発 (961)
  - ASP.NET (26)
  - AllJoyn (2)
  - Android (22)
  - Arduino (22)
  - Azure (15)
  - Azure Functions (1)
  - Bluetooth (5)
  - C# (223)
  - C++ (61)
  - C++/CX (9)
  - CakePHP (36)
  - Docker (1)
  - Excel VBA (2)
  - F# (51)
  - Fortran (10)
  - Javascript (1)
  - M5Stack (2)
  - MonoBrick (2)
  - MySQL (11)
  - NET Core (7)
  - Netduino (2)
  - Objective-C (18)
  - OpenCV (13)
  - PHP (2)
  - PIC (1)
  - Perl (1)
  - QXエディタ (5)
  - ROS (2)
  - RaspberryPi (48)
  - RmClient (1)
  - SQLite (4)
  - Scratch (4)
  - Slack (3)
  - Smalltalk (1)
  - Swift (1)
  - TDD (7)
  - TiddlyBot (1)
  - Trac (4)
  - Umbraco (1)
  - VB (19)
  - WPF (11)
  - Win IoT (19)
  - WinRT (60)
  - Windows 10 (5)
  - Windows Phone (2)
  - Wordpress (20)
  - XAML (12)
  - Xamarin (85)
  - iOS (13)
  - iPad (5)
  - mBot (1)
  - mbed (1)
  - python (2)
  - xUnit (12)
  - サイドバーガジェット (5)
  - データベース (4)
  - ブログパーツ (15)
  - 子供ツイッター (3)
  - 技術メルマガ (3)
  - 組み込みボード (4)
- 設計 (33)
- UIDD (7)
- プロジェクト管理 (42)
- Plan Language (7)
- 仕事 (21)
- ツール (49)
  - EXDoc (9)
  - XmlDom (3)
  - 花札ゲーム (4)
- 起業塾 (12)
- 書籍 (9)
- ブログ (5)
- 雑談 (153)
- PDA (11)
- インストールマニアックス2009 (7)
- EV3 (5)
- FEM (1)
- OpenCCPM (5)
- PLEN2 (2)
- PP-Club (3)
- RealSense (2)
- chu (5)
- windows 8 (59)
- windows 8.1 (4)
- のだめ開発プロセス (5)
- アズレン (1)
- ギター (2)
- ソフトウェア開発者の道具箱 (4)
- トラブルシューティング (7)
- パフォーマンス (7)
- プチロボ (6)
- ロボットアーム (2)
- 勉強会 (12)
- 最強.NET開発PC (13)
- 段取り (3)
- 艦これ (12)
Blogroll
リファレンス
メタ情報

2025年4月
日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

指定したTwitterアカウントの全ツイートを取得(暫定.NET版)

指定したTwitterアカウントの全ツイートを取得(暫定.NET版) への4件のフィードバック

最近の投稿

最近のコメント

menu

アーカイブ

カテゴリー

Blogroll

リファレンス

メタ情報