2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

GoogleAPIってどうよ?

1 :nobodyさん:02/04/12 21:27 ID:Mmm+bS50
これってなんなの?

2 :nobodyさん:02/04/12 21:32 ID:???
なにがよ?

3 :nobodyさん:02/04/12 21:48 ID:PmNs52St
落としてみたよ

4 :nobodyさん:02/04/12 21:49 ID:PmNs52St
詳細はコレ
http://www.watch.impress.co.jp/internet/www/article/2002/0412/googapi.htm

5 :nobodyさん:02/04/12 22:25 ID:PmNs52St
よーするに検索とその結果をどーこーするのを自動化できるだけみたいね


6 :nobodyさん:02/04/12 22:43 ID:???
あんな巨大なデータベースをただで利用できるかもしれないなんて凄いじゃん

7 :nobodyさん:02/04/12 22:55 ID:6uRbi+1h
キタ━━━━━━(゚∀゚)━━━━━━━!!!!!
祭りの予感。
使いにくいGoogleimodeが改良出来るかも(涎

8 :nobodyさん:02/04/12 22:58 ID:PmNs52St
うーんコレといって面白い用途が見つからない・・
ムーノーファンとしては援助交際の地域と価格と年齢のデータベースでも作るか

9 :nobodyさん:02/04/13 00:00 ID:???
ttp://www.petitcharat.com/
ttp://rito.gi-ga.net/intl/ja/

こういうトコは検索結果画面も萌えを出せるんじゃない?

10 :nobodyさん:02/04/13 00:29 ID:2L4+RYge
SOAPがなんたるかを知ってる人でないと
(GoogleAPIを使うのは)難しい。

11 :nobodyさん:02/04/13 01:47 ID:CDgHcgOU
>>9
スマン。現状でも検索結果画面の画像変えたりできるのだが…
http://www.google.com/intl/en/services/free.html

12 :nobodyさん:02/04/13 02:51 ID:nhbHO6x6
SOAPなんて使うだけなら難しくないだろ
http://www.oreillynet.com/cs/weblog/view/wlg/1283

13 :nobodyさん:02/04/13 12:26 ID:o5JFoopV
.NET版のサンプルで日本語検索したいんだけど、
受け付けてくれない。

日本語を入力した場合のSOAPからの戻り値GoogleSearchResultオブジェクトの
値は、、??になってて、どうやらどこかで化けてるっぽいので、文字エンコーディングの
指定かなと思うのですが、

GoogleSearchResult r = s.doGoogleSearch(keyBox.Text, searchBox.Text,
0, 1, false, "", false, "", "utf8", "utf8");

でもダメです。これって誰がどこでsearchBoxの値をこの引数にしたがって
エンコードしてるの?という疑問があるのですが、何かご存知の方
いますでしょうか?



14 :nobodyさん:02/04/13 15:13 ID:zhbtrc61
>>13
日本語を先に円コーディングして渡さないとだめなんじゃないの?


15 :親切な人:02/04/13 15:23 ID:???

ヤフーオークションで、凄い人気商品、発見!!!

「高性能ビデオスタビライザー」↓
http://user.auctions.yahoo.co.jp/jp/user/NEO_UURONNTYA

ヤフーオークション内では、現在、このオークション
の話題で、持ちきりです。

16 :nobodyさん:02/04/13 15:29 ID:2+bIhQ/i
うーん
GoogleAPIきになるなぁ…
てか落としてみよう
で期待age

17 :13:02/04/13 15:44 ID:o5JFoopV
>>14
でも、引数はString型なんだよね・・・。

Java版も同じく化ける。

基本的にSOAPの文字コードは、SOAPのAPIで勝手に
UFT-8に変換して渡してくれるものだと思ってるのだが・・・・。

でも、

http://www.atmarkit.co.jp/fdotnet/opinion/yoshimatsu/onepoint01.html

↑で作ってるデモのキャプチャでは検索条件に日本語使ってるから、
できるハズなんだが。

うーむ。

18 :nobodyさん:02/04/13 17:50 ID:3kcA2KnB
http://www.soapware.org/directory/4/services/googleApi/implementations
各種言語での実装例。perl,PHP,ruby,python,VBなどがあるよ。

19 :nobodyさん:02/04/13 18:19 ID:???
とりあえずPerlでやってみたけど、簡単にできておもしろいね。

20 :nobodyさん:02/04/13 19:08 ID:vVPBbo02
初心者な者でperlでとりあえずブラウザで表示できるソースきぶんぬ

21 :nobodyさん:02/04/13 19:10 ID:CDgHcgOU
ぉもι3ぃ。Google(・∀・)イイ!!

22 :nobodyさん:02/04/13 19:24 ID:???
>>20
ライセンスキーとらんとだめだぞ。
18のURLからNet::Google.pmとってくれば簡単だけど、
oe,ieがlatin1に固定されてた。変えても、日本語は??になってダメだった。
それにしても、
Server: e h c a p a
ってなんで逆さまなん?

23 :nobodyさん:02/04/13 23:37 ID:???
誰か日本語使えたら教えて君。

24 :nobodyさん:02/04/14 02:50 ID:2FW+icKC
IE以外のブラウザでページランクのゲージが表示できるとカコイイかも。
できるかしらんけど。

25 :nobodyさん:02/04/15 13:34 ID:+XsnId1c
興味あげ

26 :nobodyさん:02/04/15 18:27 ID:mMT6c6Wv
PHPなら日本語もOK

27 :nobodyさん:02/04/15 21:00 ID:???
>26
PHPは日本語?にならないの?
<q xsi:type="xsd:string">XML WEBサービス SOAP</q>

<searchQuery xsi:type="xsd:string">XML WEB???? SOAP</searchQuery>

28 :nobodyさん:02/04/15 23:51 ID:bGOXiD4W
日本語は単に無視されていただけと判明。
http://www.atmarkit.co.jp/fdotnet/opinion/yoshimatsu/onepoint01.html
の更新履歴より。

29 :nobodyさん:02/04/16 00:04 ID:???
all non-alphanumeric characters that are included in a search query are treated as word separators

30 :nobodyさん:02/04/16 00:22 ID:???
日本語使えないんじゃ、おもしろないな。

31 :nobodyさん:02/04/16 02:51 ID:???
>>26
なんだと!!           の  つ
 ̄ ̄∨ ̄ ̄ ̄           せ  い
   ∧_∧ イライラ…     . ら  ネ
   ( ;・∀・)y―┛~~   . .  れ  タ
 ○.(つ _ || ̄ ̄ ̄ ̄ ̄|  . る  に
 .3    |\.||   もら♪  |
 点    '\,,|==========|


32 :26:02/04/16 12:10 ID:jQ1o8etV
ネタでなくほんとにPHPでもJavaでも日本語検索できるんだけど。

33 :nobodyさん:02/04/16 13:13 ID:???
だから、日本語は無視されんだよ、ヴォケ。

34 :nobodyさん:02/04/16 15:59 ID:???
あり得ないとも言い切れないな

35 :nobodyさん:02/04/16 16:29 ID:???
日本語が使いてぇんだよ!

36 :nobodyさん:02/04/16 17:43 ID:jQ1o8etV
PHPだったらPEARのSOAP使って、エンコードはなんでもいいや。
とりあえずEUC-JPで。
それで日本語文字列をQueryとして与える。(あえて日本語だけで。)
それから検索をかける。
すると、InputEncoding、OutputEncodingを指定したにも関わらず
UTF-8で結果が返ってくる。
そいつをmb_convert_encodingでEUCに変換。
取得できた検索結果の個数・該当した内容などを得ておく。

次にGoogleで実際に検索してみる。
検索結果は同じになりました。

Javaにおいても同様。
QueryのStringをエンコードを変換してからdoSearchかければ同様に
結果を得られる。

上の方でなにやら日本語が無視されるとか言ってるのはあくまでXML
とか使った場合でしょ?
別に与えられたAPI使って普通にやれば日本語の検索も問題なく可能だよ。



37 :26:02/04/16 18:02 ID:???
いま試しに「XML Webサービス UDDI SOAP WSDL」これを、
PHP・Java双方で試してみました。
結果はGoogleで直接得た検索結果と同様のものが得られました。


38 :nobodyさん:02/04/16 19:00 ID:???
神降臨の予感

39 :nobodyさん:02/04/16 19:19 ID:???
ttp://www.google.com/search?hl=ja&q=%82%DC%82%F1%82%B1&lr=lang_ja
ttp://www.google.com/search?hl=ja&ie=euc-jp&oe=euc-jp&q=%A4%DE%A4%F3%A4%B3&lr=lang_ja
ttp://www.google.com/search?hl=ja&ie=UTF-8&oe=UTF-8&q=%E3%81%BE%E3%82%93%E3%81%93&lr=lang_ja

40 :nobodyさん:02/04/16 22:19 ID:tqSjUO7j
すんごい基本的なこと聞きますけどこのAPIを使うのはどういった環境が必要なんですか?
メモ帳でperlつくってActiveperlだけじゃだめなんでしょうか

41 :nobodyさん:02/04/16 22:21 ID:???
>perlつくって

Larry Wallさんはじめまして

42 :nobodyさん:02/04/16 22:22 ID:???
2chって凄いな


43 :nobodyさん:02/04/16 22:24 ID:tqSjUO7j
>>41-42
氏ね、まじでわからんのだ

44 :nobodyさん:02/04/16 22:25 ID:???
> メモ帳でperlつくって
まさかそんな高機能エディタを使っていたとは。
やはり神だ > らリーウォーる

45 :nobodyさん:02/04/16 23:00 ID:5e77AUz/
日本語検索しようとすると ->doGoogleSearch 部(SOAP::Lite使用)で
500 Internal Server が返ってくるな・・・。

46 :nobodyさん:02/04/16 23:00 ID:???
こんなAPI使えるような技術力が欲しいなぁ。

47 :nobodyさん:02/04/17 00:06 ID:???
>>37
日本語だけで検索してみろヴォケ。

48 :26=36=37:02/04/17 01:01 ID:XwJW97mq
だから、日本語だけで検索できるって36で書いたろ?
おれに文句言う前につくってみりゃいいだろよ。ちゃんとできるから。


49 :nobodyさん:02/04/17 01:50 ID:???
>上の方でなにやら日本語が無視されるとか言ってるのはあくまでXML
>とか使った場合でしょ?
SOAP知らねーくせに、うるせーよ、お前。

>別に与えられたAPI使って普通にやれば日本語の検索も問題なく可能だよ。
別に与えられたって何のことだよ。意味わかんねーよ。

50 :nobodyさん:02/04/17 03:28 ID:???
日本語使えるぞ。検索結果の数が合わないけど。(原因不明)

http://webprog.laboratory.jp/Google.php

51 :nobodyさん:02/04/17 09:18 ID:???
49=馬鹿 晒しage

52 :お役立ちサイトです。:02/04/17 09:29 ID:Rv1vXeJ+
役立つサイトを満載したサイトです。
是非見にきてください。
http://home9.highway.ne.jp/cym10262/

53 :nobodyさん:02/04/17 11:54 ID:???
google自身もphp

54 :nobodyさん:02/04/17 12:11 ID:???
51=ドキュソ 晒しage

55 :nobodyさん:02/04/17 16:10 ID:???
49=54=厨房 晒しage

56 :nobodyさん:02/04/17 17:58 ID:???
話し言葉を解析するエンジンがあればgoogleで話し言葉による検索も不可能じゃないな。

57 :nobodyさん:02/04/17 18:03 ID:???
結局日本語は検索できるの?

58 :nobodyさん:02/04/17 20:04 ID:???
>> 57
>>50で実際に、自分のその手で試してみれ、自分のその目で確かめてみれ?

59 :詩人がいるな:02/04/17 20:20 ID:???
詩人がいるな

60 :57:02/04/17 20:29 ID:???
て事は出来ないのか。

61 :nobodyさん:02/04/17 21:22 ID:???
おお!日本語使えるじゃん

62 :50 ◆wfMSpsRY :02/04/17 22:26 ID:???
http://webprog.laboratory.jp/GoogleAPI/

スペルチェックとキャッシュ表示も付けてみた。

63 :nobodyさん:02/04/17 23:09 ID:???
>>62
数が合わない原因わかりましたか?

64 : ◆wfMSpsRY :02/04/17 23:21 ID:???
誤差範囲だと思う事にしてる(ぉ

65 :nobodyさん:02/04/17 23:45 ID:xDR0+dpq
>>36
要するに、EUCをURLエンコードすれば
通るってことでよいですか?

(だとすると、.NETだと無理じゃん・・・。)

思うにUTF-8やシフトJISをURLエンコードするから、
受け付けてくれないってことで、XML(SOAP)云々は
無関係でしょ。

66 :nobodyさん:02/04/18 00:02 ID:???
>>64
繁字体中国語とか韓国語で引っかかるぽいです<件数。
検索の最後に、

最も的確な結果を表示するために、上のXX件と似たページは除かれています。
検索結果をすべて表示するには、ここから再検索してください。.


これが怪しいかも

67 :nobodyさん:02/04/18 00:15 ID:FWvEVOTg
>>65
いや、URLエンコードではないでしょ。
.NETってよく知らないけど、Javaみたいなもんなの?
Javaの場合はISO-8859-1に文字コード変えてからじゃないと
日本語が通らない。
Javaの場合だけども、
String query = new String("日本語".getBytes(), "8859_1");
みたいな感じでやるとちゃんと認識される。


68 :nobodyさん:02/04/18 00:36 ID:???
ie を SJISとか指定すれば文字コードは何でも良いような・・・

69 :65:02/04/18 01:08 ID:fDnwsV8Q
>>67
JavaのString型ってUnicode文字列だしょ?

>String query = new String("日本語".getBytes(), "8859_1");

って、どのようにUnicodeに変換するか?の指定なんじゃないの?
よく、Servletで送られてくる日本語が文字化けするので、
一度、バイト配列に変換してから、Unicodeに変換してるけど。

うーん、うまくいかないなぁ。
もし、よかったら、周辺のソースファイルをアップしてもらえんでしょうか?


70 :nobodyさん:02/04/18 01:08 ID:???
>>68
ttp://www.google.com/search?hl=ja&q=%82%DC%82%F1%82%B1&lr=lang_ja
ttp://www.google.com/search?hl=ja&ie=euc-jp&oe=euc-jp&q=%A4%DE%A4%F3%A4%B3&lr=lang_ja
ttp://www.google.com/search?hl=ja&ie=UTF-8&oe=UTF-8&q=%E3%81%BE%E3%82%93%E3%81%93&lr=lang_ja

71 : ◆wfMSpsRY :02/04/18 22:16 ID:???
要望も無いのにサンプルコード公開。
妙なトコあるだろうけど勘弁して。半年以上振りのphpなの(言い訳

http://webprog.laboratory.jp/GoogleAPI/search.php
http://webprog.laboratory.jp/GoogleAPI/search.phps
http://webprog.laboratory.jp/GoogleAPI/Nanashi/GoogleAPI.phps

72 :nobodyさん:02/04/18 22:32 ID:???
>>71
ナウい。

73 :nobodyさん:02/04/19 00:31 ID:vCV4FxxT
>>71
$q = get_magic_quotes_gpc() ? $_GET['q'] : stripslashes($_GET['q']);

これ逆じゃない?

74 : ◆wfMSpsRY :02/04/19 01:19 ID:???
あれ。.phpsの方だけミスってた。
アリガト。

75 :nobodyさん:02/04/19 13:51 ID:???
http://aspn.activestate.com/ASPN/WebServices/Google

76 :nobodyさん:02/04/21 04:47 ID:???
既出なことろですけど一応貼っておきます
ttp://www.asahi-net.or.jp/~cs8k-cyu/gglwebapi/


77 :nobodyさん:02/04/22 00:54 ID:E11XSqh+
age

78 :nobodyさん:02/04/23 02:40 ID:1u/F8eaz
激しくガイシュツだけど、これも貼っとく。
ttp://www.sarion.co.jp/ml/soap/archive/200204.month/854.html

79 :nobodyさん:02/04/23 15:08 ID:???
API使えても、どう使っていいか解らない罠(w

つまりだ、ネタが無いんだよな

80 :nobodyさん:02/04/23 22:16 ID:???
>>79
要はアイデアだよな。検索結果の本文の一部が得られる所でなにか
使えないかと考え中・・・・・・・・・・・・・・(タイムアウト



81 :nobodyさん:02/04/25 00:15 ID:iJIRxstU
iATOKみたいに、日本語を変換するとGoogleで検索したURLになるというのはどう?
ttp://www.iatok.com/what2/index.html
だれかCannaあたりで作らないかな。

82 :nobodyさん:02/04/28 12:14 ID:/2WvoDQx
APIとは直接関係ないけど、変なことに気づきました。
Googleで同じ検索語句でも結果が違うことがあります。
例えば、「携帯用浄水器」で検索すると、通常303件でてきます。
しかし、まれに285件しかでてこないのです。
Googleと提携しているYahooでは検索結果は一定です。
何かテストしているのでしょうかね。

83 :nobodyさん:02/04/28 16:13 ID:???
(´-`).。oO(>>82 ロボットがデータベースを更新する際にロックかけて
 他のプロセスから読めないようにしているからでは?)

84 :82:02/04/29 12:16 ID:ZYofkKZz
>>83 どうも昨日はデータベース更新の境目だったようです。
本日、同一語句で検索すると、286件で一定していました。
Yahooでも同じでした。
しかし、303件が286件に減ったのは何故でしょうか?
削除された17件の中に知り合いのサイトが含まれています。
サイトのURLで検索しても出てこないんですよ。
Googleのスパイダーがサイトに来た時に、サーバーが落ちてたとしたら
サイト閉鎖とみなされてデータベースから削除される、なんてことは
あり得るのでしょうか?

85 :nobodyさん:02/04/29 12:31 ID:???
(´-`).。oO(シラネーヨ)

86 :nobodyさん:02/04/29 18:34 ID:???
数分キャッシュが読めない時なら結構ある。
そのあとキャッシュのデータも更新されてるから、これが原因だと思うけど

87 :nobodyさん:02/04/30 19:55 ID:H3MSWX6q
age

88 :nobodyさん:02/05/01 01:16 ID:fRFOuman
KAKASIとかCHASENと組み合わせたら、
自然言語の検索も可能になるかな?
おおきな、勘違い?

89 :nobodyさん:02/05/05 11:01 ID:ifDMBpXd
test

90 :nobodyさん:02/05/05 21:21 ID:???
鯉のぼりage

91 :nobodyさん:02/05/05 21:22 ID:r2zPlfgb
再age

92 :nobodyさん:02/05/08 22:04 ID:f3dq0b/e
age

93 :nobodyさん:02/05/09 01:44 ID:???
>>81
それいいかも。
会社や製品のページ行くのに URL 打つのが面倒なので
google バーから検索することがよくある。

>>88
>自然言語の検索も可能になるかな?
自然言語の検索って何?

94 :nobodyさん:02/05/13 02:44 ID:???
GoogleAPI に入ってなかったんだけど、
GoogleToolbar が使ってる、PageRankを取り出す方法って
教えてほしい

95 :nobodyさん:02/05/13 11:10 ID:???
複数あるデータベースの内容の同期に時間がかかって
誤差がでる可能性があるのでわ>検索結果の違い

96 :nobodyさん:02/05/13 11:36 ID:SwJ6qbls
C#で日本語検索ができるサンプルきぼん

97 :あぼーん:あぼーん
あぼーん

98 :nobodyさん:02/05/13 17:55 ID:r9Pp2mnu
>>40-44
仕事中なのに大笑いしちまったじゃないかー。


99 :nobodyさん :02/05/13 18:52 ID:GziI+Tms
       @ノノヽヽヽ@ ミ _ ドスッ
       ( ・^▽^)─┴┴─┐
       /   つ.  99 │
      /_____|└─┬┬─┘
        ∪ ∪    ││ _ε3



100 :nobodyさん:02/05/13 18:54 ID:nc8iQoLT
 _____
 |  |. ∧∧
=====(,,゚Д゚)n= < トォッ!!
 |_|⊂  ソ
    / _、)
   ノ /ι´
   じ
  ///
 从从 ダンッ!


      \
       ヾ           \\
        ∧∧      _  ヾ ヾ
        (   ,,)┌―─┴┴─―┐
       /   つ  100 ゲット! │
     〜′ /´ └―─┬┬─―┘
      ∪ ∪        ││・.。'  ズドッ!
                ゛゛'゛'゛ `.


101 :nobodyさん:02/05/13 18:55 ID:???
100ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ


102 :nobodyさん:02/05/13 18:55 ID:???
くそぉ!102ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ


103 :nobodyさん:02/05/13 22:20 ID:???
漏れの場合、串経由だとなんか使えないっぽいんだけどお前らはどうよ?
SOAP-ENVヘッダになんか書けばいいのか?

リア厨丸出しでスマソ。

104 :nobodyさん:02/05/15 19:12 ID:???
>103
SOAPHTTPConnection でproxy鯖のIPアドレスとポート番号を
指定すればOK

105 :103:02/05/15 23:46 ID:???
>>104
とりあえずその方法でなんとか切り抜けたけど、apacheのAPI触らないで
com.google.soap.searchパッケージだけでなんとか…ならんか。

106 :nobodyさん:02/05/17 01:47 ID:???
http://www.google.co.jp/webhp?q=&ie=UTF8&oe=UTF8&hl=ja

107 :nobodyさん:02/05/17 01:54 ID:???
http://www.google.co.jp/preferences?hl=ja&lr=&ie=UTF8&oe=UTF8

Cookieがバグって時々出現するんだけどUTF-8て表示オモー

108 :nobodyさん:02/05/19 18:33 ID:???
>>40
ラリーウォールさんって本物?

109 :nobodyさん:02/05/21 11:05 ID:nEy80zlD
C#のサンプル無いの?

110 :nobodyさん:02/05/23 10:56 ID:???
   ┌┴┐
イ呆  寸


111 :nobodyさん:02/05/23 17:54 ID:???
111ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ


112 :nobodyさん:02/05/27 03:35 ID:???
>>109
え?サンプルついてませんでした?

113 :nobodyさん:02/05/30 04:14 ID:???
>>109
他の言語のコード見て、頭の中にC#のコード浮かばないおまえは逝ってヨシ。

114 :nobodyさん:02/06/02 04:30 ID:PwFg+ZQv
数週間前から自社の実験的技術の公開に踏み切っていたGoogleが、5月31日、
賞金1万ドルのコンテストの受賞者を発表した。

 Google初のプログラミングコンテストの優勝者はニューヨーク在住のプログラマー、
Daniel Egnor氏。同氏がエントリーした作品は、研究者が特定の地域内のWebページ
を発見できるようにする技術だった。ニューヨークの投資銀行の社員である同氏は、
2カ月間、週末を費やしてこの技術を開発した。

 同氏は見事1万ドルを手にすることになったが、このコンテストの真の勝者はGoogle
かもしれない。Googleは非独占的ながら、この技術の幅広いライセンス権を確保して
いるからだ。また、この技術だけでなく、コンテストにエントリーされた全技術に対して
同様の権利を持つ。
(以上、2002年6月2日のZDNet JAPANより一部引用―全文は引用元を参照)

引用元: http://www.zdnet.co.jp/news/0206/01/nebt_13.html
リクエスト: http://news.2ch.net/test/read.cgi/newsplus/1022738549/578

社会的にもプレゼンスを上げる、実にうまいやり方だと思う。>Google

115 :nobodyさん:02/06/02 04:34 ID:PwFg+ZQv
http://www.google.com/programming-contest/winner.html

2002 Google Programming Contest Winner

Google is celebrating its fourth year of connecting users to i
nformation worldwide by seeking out and rewarding exceptional
programming skills. We're pleased to announce that the winner
of Google's 2002 Programming Contest competition, and the
recipient of the $10,000 cash prize is:


Daniel Egnor
Project title: Geographic Search

Daniel's project adds the ability to search for web pages within a
particular geographic locale to traditional keyword searching.
To accomplish this, Daniel converted street addresses found within
a large corpus of documents to latitude-longitude-based coordinates
using the freely available TIGER and FIPS data sources, and built a
two-dimensional index of these coordinates. Daniel's system provides
an interface that allows the user to augment a keyword search with the
ability to restrict matches to within a certain radius of a specified address
(useful for queries that are difficult to answer using just keyword searching,
such as "find me all bookstores near my house"). We selected Daniel's
project because it combined an interesting and useful idea with a clean
and robust implementation.

Daniel received a bachelor's degree in Computer Science from Caltech in 1996.
He has worked for Microsoft Corporation and XYZFind Corporation, and currently
resides in New York City working for a large investment bank.



116 :nobodyさん:02/06/02 06:09 ID:???
>>115
Googleのデータベースから緯度経度等の地理情報を二次元座標のインデックスとして構築することで
「自宅から半径○km以内の書店」等、特定の地域内のWebページを検索し発見できるようにする、と。
凄く情報密度の濃いMapFanスポット検索みたいなものかな。

117 :nobodyさん:02/06/02 10:28 ID:???
けっこう、革命的な技術だと思うがどーよ。

118 :nobodyさん:02/06/03 09:33 ID:???
検索じゃ特定の狭い地域内の情報だけを集めるの難しかったからな

119 :nobodyさん:02/06/05 01:39 ID:???
Geographic Search ソースコード、GPLで公開age

120 :nobodyさん:02/06/05 02:07 ID:???
Graphic Searchって日本でも使えるの?
>using the freely available TIGER and FIPS data sources
このTIGERとかFIPDが全地球規模のデータベースなのかつーことだが。

121 :nobodyさん:02/06/05 21:00 ID:HQpt/dEr
とりあえず、perl(SOAP::Lite)でも日本語とおりました。
http://64.125.182.162/google-sample/sample.cgi
http://64.125.182.162/google-sample/sample.txt


122 :121:02/06/06 03:08 ID:???
すいません。ガイシュツだったようですね
>$SOAP::Constants::DO_NOT_USE_CHARSET = 1;


123 :nobodyさん:02/07/31 16:14 ID:???
保守

124 :nobodyさん:02/08/09 12:46 ID:???
hoshu

125 :nobodyさん:02/08/18 02:27 ID:???
ニュー速いってみ

126 :ヽ( `Д´)/ ウワーン:02/08/23 16:10 ID:???
googleの表示設定が真っ白だよーヽ( `Д´)/

127 :nobodyさん:02/08/23 16:51 ID:qvjm8OVK
>>126
真っ白じゃないよ?(・ε・)

128 :ヽ( `Д´)/ ウワーン:02/08/23 16:57 ID:???
どうして?どうして?漏れだけなんだよーヽ( `Д´)/ ウワーン
>>127
IEとかの設定が悪いのかなぁ?

129 :nobodyさん:02/08/23 17:56 ID:JDE6Kj7Q
>>128

ブラウザの問題のようで、同じようになったけどほっといたら直った。


130 :ヽ( `Д´)/ ウワーン:02/08/23 18:03 ID:???
>>129
>ほっといたら・・・
真っ白のまま表示させといて時間がたてば文字が出てくるのですか?

131 :nobodyさん:02/08/24 10:01 ID:???
>>130
それは何か私には分からない不思議な「パワー」なのですか?

132 :nobodyさん:02/08/24 10:11 ID:???
>>131
約千年に一度、地磁気の影響で、バグが直る場合があるらしいですよ?

133 :nobodyさん:02/09/07 19:31 ID:???
GoogleAPI で PageRank は取得できないのでしょうか?


134 :133:02/09/07 20:15 ID:???
>>133

自己レス。方法は見つかったが、チェックサム(ハッシュ)の計算方法が分からない。

 http://www.webmasterworld.com/forum3/1057.htm

(1)Google Toolbar のコードを解析する勇者
(2)上記タスクのための優良デバッガ
 (IE 用ツールバーのコードをデバッグできるデバッガ)

いずれかを求む。
(あ、もちろん違法スレスレなんで、この手の話題が嫌いな人は無視して。)


135 :るびきち:02/09/25 02:57 ID:aSAWs0dV
とりにく オーブン焼き
鶏肉 オーブン焼
とり肉 オーブン焼き

レシピとか検索するとき、表記のゆれをいちいち入力しています。

正規表現を生成して(migemoみたく)
できますでしょうか。




136 :nobodyさん:02/09/25 03:03 ID:???
>>135
Googleに元からある機能でできるが、、、

とりにく OR 鶏肉 OR とり肉 オーブン焼き

137 :nobodyさん:02/09/27 15:21 ID:ydqSU/we
proxy経由での接続はできないのん?
>>104のSOAPHTTPConnectionって使い方
http://www.soaplite.com/
に載ってます?

138 :John ◆Re0z.4Is5E :02/10/05 23:31 ID:zxykE+jB
日本語での検索はできないんだよね?
日本語をローマ字表記すればできるんだっけ?

139 :nobodyさん:02/10/06 00:17 ID:???
>>138
可能>>36-

140 :nobodyさん:02/10/07 13:21 ID:???
age

141 :nobodyさん:02/11/16 19:45 ID:???
ぐぐって と ぐるって どっちがいい? どっちもすてがたい。 
ぐぐるって はながいな。 おもいきって ぐって にしようよ?

142 :山崎渉:03/01/15 13:45 ID:???
(^^)

143 :山崎渉:03/03/13 17:38 ID:???
(^^)

144 :nobodyさん:03/03/21 19:06 ID:JpMZ+F8/
任天堂

連邦

って検索できる?
エラーになるっす。

145 :デブおた山崎渉 :03/03/21 19:11 ID:???
( ´;^;ё;^;)

146 :プチSOAP使い:03/03/21 19:13 ID:???
>>144
SJISで送るのやめなさいな。


147 :144@PHP使われ:03/03/21 21:02 ID:JpMZ+F8/
>>145こんにちは。

>>146
「表示」だと文字化けしないです。

ちなみに環境は
Win2k
PHP4.3.1
php_mbstring
PEARのSOAP
です。

フォーム用htmlは charset=x-euc-jp
PHP→SOAPの時に mb_convert_encoding($query,"UTF-8", "auto");
SOAP→PHPの時に mb_convert_encoding($url, "EUC-JP", "UTF-8");
出力もcharset=x-euc-jp
html、PHPファイルともにeuc&LFで保存。

う〜ん。。。


148 :プチSOAP使い:03/03/21 22:37 ID:???
>>147
エラーが出るときのSOAPリクエストって見せてもらえます?
エラーメッセージもわかれば教えてほしいです。

149 :144@PHP使われ:03/03/21 22:51 ID:???
私のところではエラーの表示がでないんですけど、
とあるHPで同じような環境でやっているところがあって
上記のキーワードで検索すると

>parsing error: org.xml.sax.SAXParseException: An invalid XML character (Unicode: 0x0) was found in the element content of the document.
と出てきます。
0x0って何のこっちゃ。。。

で、クエリーが「任天堂」だとすると「?醇・」ってなっちゃいます。

(それにしてもPHPで文字列の16進数のダンプ表示ってどうするんだろう。。。)

150 :PHP使われ :03/03/21 23:04 ID:JpMZ+F8/
あれ?
org.xml.sax.SAXParseException
ってJavaかな…

151 :tantei:03/03/21 23:19 ID:???
★あなたのお悩み解決致します!!
●浮気素行調査
彼氏、彼女、妻、夫の浮気を調査致します!!
●盗聴器盗撮機発見
あなたの部屋に誰かが仕掛けているかも!!
●行方調査
行方不明になっている家族の消息を調査致します!!
●電話番号から住所割り出し
一般電話、携帯から住所を割り出し致します!!
●ストーカー対策
社会問題ともなっているストーカーを撃退致します!!
その他人生相談からどんなお悩みでも解決いたします!!
 直通  090−8505−3086
URL  http://www.h5.dion.ne.jp/~grobal/
メール  hentaimtt@k9.dion.ne.jp
   グローバル探偵事務局 



152 :nobodyさん:03/03/21 23:20 ID:???
>>150
Apache SOAPかAxisの予感。

153 :nobodyさん:03/03/21 23:20 ID:???
>>152
訂正。SAXだからApacheSOAPの可能性はないや。

154 :nobodyさん:03/03/23 02:37 ID:e5OWCaWV
アカウント作成したけど、ライセンスキーが届かない…。
ライセンスキーは何日ぐらいで届くものなの?

155 :nobodyさん:03/03/23 15:39 ID:YYgYrLyX
瞬時におくられてきますた。

156 :nobodyさん:03/03/24 01:25 ID:KHMg43Dc
>>149
Google Web APIで日本語を扱う際のポイントは以下のページで紹介されています。
http://www.asahi-net.or.jp/~cs8k-cyu/gglwebapi/
但し、現在の状況と符合しない部分があるかもしれないことに注意してください。

157 :nobodyさん:03/03/24 01:34 ID:OvtTNLHe
http://218.44.246.37/~2ch/

158 :山崎渉:03/04/17 12:12 ID:???
(^^)

159 :山崎渉:03/04/20 06:21 ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

160 :山崎渉:03/05/22 02:21 ID:???
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

161 :山崎渉:03/05/28 17:09 ID:???
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

162 :nobodyさん:03/06/07 11:05 ID:Hl350tJ2
>>156
参考になりました。ありがとう。
Google APIサイコー!!



163 :直リン:03/06/07 11:10 ID:XZEhfRTk
http://homepage.mac.com/yuuka20/

164 :nobodyさん:03/06/09 01:44 ID:iRgYYf1N
で、デフォルトで日本語はOKになったわけ?

165 :山崎 渉:03/07/15 11:12 ID:???

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

166 :nobodyさん:03/07/20 21:06 ID:QRY/RLL+
>>154
私もライセンスキーが届きません。
どうすればいいのでしょう??



167 :直リン:03/07/20 21:13 ID:J9gjdEEQ
http://homepage.mac.com/maki170001/

168 :nobodyさん:03/07/23 20:25 ID:???
めちゃすぐ届いた記憶あり。障害に気づかず放置プレイかもね。

169 :nobodyさん:03/07/24 17:17 ID:PVxdm8UI

これって今でも1000query/日しか出来ないんですか?

170 :nobodyさん:03/07/24 18:16 ID:UPsOpl1M
なんか17:00くらいからつながらないんだけどぉ

171 :170:03/07/24 21:53 ID:???
他にも誰か障害ある人いる??

172 :nobodyさん:03/07/31 14:34 ID:???
漏れ人に脳にあるって言われる


173 :山崎 渉:03/08/02 02:24 ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

174 :ぼるじょあ ◆ySd1dMH5Gk :03/08/02 04:53 ID:???
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ

175 :nobodyさん:03/09/12 11:29 ID:L2Twm04Z
PHPで日本語が通るサンプルが欲しいんですけれど
ありませんでしょうか?

自分で作ってみたんですけれど日本語で検索すると
結果がいつも同じものになってしまいます。

ちなみにNuSOAPを使ってます。
よろしくお願いします。

176 :nobodyさん:03/09/12 12:50 ID:wy8c1f8H
ぬるり

177 :nobodyさん:03/09/18 13:32 ID:OomwOh7u
.

178 :nobodyさん:03/09/18 13:42 ID:OomwOh7u
googleapiつかわずに、これと似た機能を実現するにはどうすればいいNO?
1000query/日じゃあ、つかえねーんだよ!

179 :nobodyさん:03/09/18 13:50 ID:???
API通さないで検索結果拾い捲るとアクセス制限喰らうらしいが

180 :nobodyさん:03/09/18 14:47 ID:???
>>179
へー、そうなんですか・・・


181 :nobodyさん:03/09/18 17:55 ID:/RiQwiHS
>>179
>>API通さないで検索結果拾い捲るとアクセス制限喰らうらしいが
どーゆーこと?ヴァカにもわかるように教えてくださいっつーの!!

182 :nobodyさん:03/09/18 20:14 ID:nGSwS+tg
>179
1秒間隔で、連続して検索を実行すれば、プログラムで検索を
実行しているのが、ログファイルからばれてしまう。でも、
5秒以上間隔をおけば、API通さないで検索結果拾いをしても
ばれない。

183 :nobodyさん:03/09/18 20:17 ID:nGSwS+tg
>179
Google Hacksという本に書いてあった。でも、日本の
Googleのページのどこを読んでも、「API通さないで検索結
果拾いを禁止する」なんて書いていませんよね?

184 :nobodyさん:03/09/18 21:40 ID:ykzED/23
>>182
まじっすか?
じゃあ、5秒以上間隔をあければ、1日1000query以上も官能なの?

185 :nobodyさん:03/09/18 21:55 ID:nGSwS+tg
>184
APIを通さなければ、一日何千回でも使えるが、短時間に連続して
アクセスすると、API以外のプログラムでのアクセスと判断され、
制限がかかる、ということ。

186 :nobodyさん:03/09/18 22:24 ID:???
以前、こんなことがありました。

googleがCPANモジュール作者に削除要請
http://slashdot.jp/articles/02/03/04/1957254.shtml

187 :nobodyさん:03/09/19 19:19 ID:d1imFEE2
googleapiをダウンしたんだけーど、
% java -cp googleapi.jar com.google.soap.search.GoogleAPIDemo ライセンスキー search プロ野球
としても検索されずに、こんなんが出てきやがった!!

Parameters:
Client key = ライセンスキー
Directive = search
Args = プロ野球
Exception in thread "main" java.lang.InternalError: unexpected exception during linking: java.lang.ClassNotFoundException: com.ibm.xmi.framework.WriterFactory

だれか、助けてぷりーず。
ちなみに、OSはRD9.0でつ。

188 :187:03/09/19 19:20 ID:d1imFEE2
RDじゃなく、RedHatです。

189 :221:03/09/19 22:06 ID:8UmudfeU
age

190 :(*∠_*) ダカラドーシタ:03/09/27 17:11 ID:???
■日本人プログラマーよGoogleを攻略せよ 2003年09月24日 CNET Japan - 梅田望夫・英語で読むITトレンド: http://blog.cnetnetworks.jp/umeda/archives/000697.html

Google Code Jamというプログラミングコンテスト(CNET Japan速報記事「米グーグル:「プログラミングコンテスト出場者を求む」」をご参照)が10月から11月にかけて開かれる。
参加資格は18歳以上(世界中の誰でも)。予選はオンラインで、決勝(トップ25人)はシリコンバレーのGoogle本社で行なわれる。
腕自慢の日本人プログラマーたちには、この機会にぜひその実力を発揮してほしい。

Google Code Jamのファイナリストといえば、これから腕一本でプロとして生きていきたい若い人にとっての大きな勲章になる(中途半端な学歴なんかよりうんと価値がある)。
ファイナリストに残る日本人がいれば、日本人プログラマーの実力が世界でもトップレベルにあるという事実を、広くアピールできるだろう。
さて、コンテストの仕組みとスケジュールであるが、

参加者全員から500人にふるい落とす「Qualification Rounds」、
500人を250人に絞る「Online Elimination Rounds 1」、
250人から25人に落とす「Online Elimination Rounds 2」。
ここまではすべてオンラインなので、自宅から参加できる。
そして、ファイナリスト25人はGoogle本社での「Onsite Championship Round」に進むことができる。

★google code jam 公式サイト(excite翻訳) http://www.excite.co.jp/world/url/body?wb_url=http%3A%2F%2Fwww.topcoder.com%2Fpl%2F%3F%26module%3DStatic%26d1%3Dgoogle%26d2%3Dgoogle_overview&wb_lp=ENJA&wb_dis=2

191 :nobodyさん:03/10/12 14:14 ID:v0QvxQMA
GoogleAPIってまだβなんだっけ?
課金とかはいつから始まるんだろう

#ライセンスキーが行方不明だよ、面倒くさいなぁ

192 :nobodyさん:03/10/24 21:27 ID:???
"?"とか"~"とか普通は検索できない文字を検索する方法はないんですか?

193 :nobodyさん:03/10/30 21:08 ID:???
googleAPI使っている香具師っている?
いや、なんとなく。
だって、API叩かなくても、通常の検索画面から
いろいろ切り出すだけで十分っぽいから

194 :nobodyさん:03/10/30 21:26 ID:fIsrcUrh
<稲中卓球部読んだことある?「しねしね団」は人類の敵
万病の元(アトピー性皮膚炎)
記憶のカギを握っている。男や女?>
メールや口伝えで
これをできるだけ多くの人に伝えること

195 :nobodyさん:03/11/01 23:08 ID:???
>>192
Google Hacks に載ってるという記事をどこかで見ました。
Google Hacks は持っていないので、詳細は不明です。

196 :nobodyさん:03/11/02 10:50 ID:???
>>193
使ってますよ。(まだ実験段階ですが)
検索画面から切り出す処理がめんどくさいと言うのか・・・

197 :nobodyさん:03/11/18 02:50 ID:JBgGg7JE
age?

198 :nobodyさん:03/11/22 03:21 ID:fqQ05iK2
有害サイトだけを検出する
コンテンツづくりをしたいのですが、
GoogleAPIだと可能でしょうか?

199 :nobodyさん:03/11/25 12:18 ID:Jgt+9Lne
>>198
なんかSAFESEARCHってオプションが有ったけど
(有害ページ(?)をブロックするオプション)
>setSafeSearch(boolean safeSearch)
これを使ってほげほげするのはどうよ?

200 :nobodyさん:03/12/05 23:54 ID:Ih/eg1z8
少し以前まではデフォルトで日本語検索できてましたが、
最近デフォルトでは出来なくなりました。
他にそのような方いますでしょうか?


201 :nobodyさん:03/12/06 00:32 ID:???
馬鹿じぇねえの。
cookieが消えたんだろ。初心者うざー(ーー;)

202 :nobodyさん:03/12/06 21:20 ID:cFpL96Ba
>>201


203 :nobodyさん:03/12/11 17:57 ID:???
正直、ネタはないが

204 :nobodyさん:03/12/13 13:03 ID:???
無かったら作ろう

と言うことで、
最近やったのは、google web apisからHIT数を取って来て、
その変化をmrtgのグラフにしてみたりしている。(意味があるかわからんけど)

205 :nobodyさん:04/01/01 12:09 ID:???
>>192
googleに問い合わせてみたが、"無理"と。
C++とかJ#みたいな単語についてのみ使える方法を考えていると。

>>195
となると益々、GoogleHacksに載っている内容が木になりますが

206 :nobodyさん:04/01/10 03:28 ID:???
test

207 :nobodyさん:04/01/10 03:30 ID:???
~は無理なんじゃない?
検索オプションであるから

208 :nobodyさん:04/01/10 20:41 ID:???
"~"でできるんじゃないかな。

209 :nobodyさん:04/01/11 04:25 ID:???
できないって。

"~" Searches

You may want to search not only for a particular keyword, but also for its synonyms. Indicate a search for both by placing the tilde sign ("~") immediately in front of the keyword.


210 :nobodyさん:04/04/16 00:36 ID:b5fmr+qV
hosu

211 :nobodyさん:04/05/13 14:00 ID:gihnq5aI
キャッシュデータが使いたいです

resultElementsで
URL
title:タイトル
snippet:ヒットした文字列のデータ

 ってのはわかったのですが、キャッシュは何になるんですか?


212 :211:04/05/13 18:17 ID:gihnq5aI
誰か・・。゜゜(>ヘ<)゜ ゜。ビエェーン

213 :nobodyさん:04/05/16 18:25 ID:???
登録してみたんだけど、メールが来ない。
二、三日は待った方が良い?

214 :nobodyさん:04/05/16 20:31 ID:???
>>213
今はどうなっているのかわかりませんが、
ライセンスキーは、申し込み後にすぐメールできます。
ですので、違ったメールアドレスで再登録してください。

215 :213:04/05/16 22:07 ID:???
>>214
ありがとう。
即座にメールが返って来て登録できました。

216 :211:04/05/18 15:58 ID:XH5CU6iK
誰か>>211に・・。゜゜(>ヘ<)゜ ゜

217 :213:04/05/18 20:48 ID:???
>>211
my $key='....';
my $query='http://www.google.com';
my $googleSearch = SOAP::Lite -> service("file:GoogleSearch.wsdl");
my $result = $googleSearch -> doGetCachedPage($key, $query);
print $result;

Perlなら、こんなんでできたよ。
適当だから、何か間違ってるかも。

# SOAPとXMLを勉強する為に入れてみたけど、さっぱり分からんちん。

218 :211:04/05/20 16:17 ID:???
nusoapで出来るのかな?
でも情報ありがとう。m(。_。;))m ペコペコ…

219 :nobodyさん:04/06/29 22:48 ID:tykd5nRn
http://private.ceek.jp/archives/000489.html
PageRank チェックサムのアルゴリズムが解析されたらしいぞ。

220 :nobodyさん:04/07/26 23:23 ID:BExJxWuL
過疎板でageて何が悪い!

221 :nobodyさん:04/07/27 12:43 ID:???
>>211
漏れもはまったことありまつ
たしか、apiのtopページからログインしたら
すぐにメールが送られてきたような…

222 :221:04/07/27 12:45 ID:???
間違えますた
>>211 ではなく >>213
イテキマース

223 :nobodyさん:04/07/27 15:45 ID:???
コラッ! イクナ 人いないんだかだ

224 :1234:04/08/04 18:59 ID:5KUncmzd
日本語ができない、どうするの?

225 :nobodyさん:04/08/05 22:57 ID:???
>>224
俺も知りたい

226 :nobodyさん:04/08/06 09:07 ID:???
>>224, 225
日本語が出来ないと言うのは?
日本語サイトのみ検索? -> lr(language restrict) で ja を指定。
それともエンコーディング? -> utf-8でデータを送る。サーバーが返信するデータもutf-8


227 :225:04/08/06 21:48 ID:???
>>226
後者の方です。

私は1年ぐらい前、perlのSOAPLiteでgoogleAPI扱っていた。

その際、日本語の検索が出来ない事に困った。
(日本語検索が出来ないとは、「HIT数が明らかに少ない」
「上位に来るはずのページがHITしない」
「エンコードの指定が間違っているページが上位でHITする」など)

そこで、このスレの>>1-100あたりや、他のサイトを参考にし
$SOAP::Constants::DO_NOT_USE_CHARSET を変更する方法を試したところ、
正常に検索できるようになった。
(通常のブラウザから検索するのと同じ結果が返ってきた)

しかし、1ヶ月ぐらい経ったら、何故かまた検索できなくなった。
サーバに送信している文字列のエンコードがおかしいのではないかと思い
送信する文字列のエンコードを変えてみたりなど、いろいろ試行錯誤してみたが、
結局あきらめた、という経緯です。


228 :nobodyさん:04/08/08 03:34 ID:???
>>227
EUC-JPなどにすると結果がおかしくなったりした事はあったけど、
Google APIs referenceにもエンコードはUTF-8にしろと書いてあるので
検索する文字列のエンコードをUTF-8にしてみては?(ie, oeは無視されれるので関係ない)

後、$SOAP::Constants::DO_NOT_USE_CHARSET は変更しなくてもいいはず。
Net::Googleでは変更していなかったけど、UTF-8で送るとちゃんと日本語検索できてたよ。

検索結果が少なくなるのは英文字の検索でも同様なので、
日本語固有の問題ではないと思う。

229 :225:04/08/08 12:41 ID:???
>>228
UTF-8にエンコードはもちろん試してみました。
(Jcode.pmを使ってjcode("検索ワード")->utf8という風に)

Net::Googleは今まで知らなかったので、
調べて試して見ました。
しかし、やはり検索はうまくできてないようです。
(とあるwordで検索したら、ブラウザで検索するより100分の1程度しかHITしない)

原因がわかったら教えてください。

230 :225:04/08/08 12:42 ID:???
書いたソースです
----
#!/usr/local/bin/perl
use Jcode;
use Net::Google;
my $google = Net::Google->new(key=>'*********************************') ;
my $search = $google->search();
$search->query('"'.jcode("検索ワード")->utf8.'"') ;
$search->lr("");
$search->starts_at(0);
$search->max_results(1);
$search->restrict("") ;
$search->filter(0) ;
$search->safe(1) ;

foreach $r ( @{$search->response()} ) {
print " " . $r ."\n" ;
foreach $a2 (keys %$r ) {
print " ".$a2. " -> ".$r->{$a2}. "\n" ;
}
}
foreach $a1 ( @{$search->results()} ) {
print $a1 ."\n" ;
foreach ( keys %$a1 ) {
print " ". $_ ." ->" . $a1->{$_}. "\n" ;
}
}

---


231 :225:04/08/08 12:48 ID:???
ちなみに、google web apisでHIT数が少ないことに関しては、
以前こういうページを見つけたので

Google web service APIの検索結果が少ない問題
http://www.goodpic.com/mt/archives/000132.html


232 :nobodyさん:04/08/11 01:25 ID:XAxg01DA
PHPとnusoap.phpでつくったのですが、
英語でも日本語でも文字化けせずに検索できるものの、
一致件数が、オリジナルGoogleを検索したときより大幅に少ないです。

例)
短歌 オリジナルGoogle⇒312,000 API⇒5610
tanka オリジナルGoogle⇒277,000 API⇒96200

とある記事で、本番で使ってるDBとAPI用のDBは異なると読んだのですが、
みなさん、こんなに違うもんですか?

ちなみに、PHPは、内部エンコーディングはEUC、OutputはShift_JIS。
SOAPに渡す前に検索文字列はUTF-8に変換し、結果はEUCに変換してます。
というか、検索はできてるので、文字コードはOKだと思うのですが・・・
うーん・・・みなさんのとこではいかがでしょう?

233 :232:04/08/11 01:29 ID:???
>とある記事で、本番で使ってるDBとAPI用のDBは異なると読んだのですが、

あ、これ、>>231に書いてある記事だったw 失礼。いろいろ検索しまくってたので・・・

234 :232:04/08/11 01:35 ID:???
あ、すみません。結果が文字化けしてないと思ったら、一部文字化けしてました。

やはり文字コードの問題か・・・

235 :232:04/08/11 01:48 ID:???
>>234文字化けじゃなかった、中国語だった。。。スレ汚しすまそ

236 :Re:APIでの検索結果が少ない問題:04/08/11 08:32 ID:7ZtbNsSB
>>229-235

この件に関しては日本語かどうかは関係ないという認識でいいかな?根拠は>>228で示した通り、
また、APIで検索した時にHit数が少なくなるのは英語圏でも問題になっています。

>231のURI先からリンクされているforumに書かれていますが、
ブラウザで検索した時は、同一サイトのリンクをカウントするのに対し、
APIで検索した時は同一サイトのリンクは一つのみなので、結果が少なくなるそうです。

google.public.web-apiというnews groupでも同様の投稿を見かけました。
http://groups.google.com/groups?group=google.public.web-apis
頻繁に質問されてます(FAQになっていてもよさそうなのに)

どうすればブラウザで検索した時と同じ結果が得られるのかということに皆興味があるかと思うのですが
残念ながら、僕が探した限りでは結論を出している情報は見当たりませんでした。

filterオプションの設定とかが関係ありそうかなと思ったのだけど
検索する語によっては、影響があったりなかったり ...期待した通りの振舞をしてくれなかった。



237 :225:04/08/12 03:09 ID:???
>>236

>この件に関しては日本語かどうかは関係ないという認識でいいかな?根拠は>>228で示した通り、

全然違うと思われ
>>228に書かれていること(つまり、UTF-8でサーバに送っていないから駄目)が本当だとしたら、
>>230に示したソースは?


>どうすればブラウザで検索した時と同じ結果が得られるのかということに皆興味があるかと思うのですが
>残念ながら、僕が探した限りでは結論を出している情報は見当たりませんでした。

>>231のサイトには(Yahooの検索だけど)ブラウザと同じ結果が得られると書いてありましたが、
これはどうですか?
http://www.google.com/と同じ結果をgoogle web apisから得ることは、私も調べた限り不可能では、と思いました。

238 :nobodyさん:04/08/12 08:45 ID:BNPcYl+E
>>237
APIで検索した時のHIT数が少ないのは他の言語でも問題になっている為、
日本語かどうかが直接問題になっているのではない。という主張だったんですが、、
エンコードが違っていても検索結果が変わってくるので、全く関係なくはないかな。
"エンコードに関わらずHit数が少なくなる要因がある"に訂正します。

UTF-8以外の特定のエンコードでクエリを送った場合、
その検索文字のエンコードのみが検索対象になるようです。
例えば、EUC-JPの文字を送れば検索結果もEUC-JPで返ってくる。
期待していたサイトが上位にこないという現象は、
検索する文字列をのエンコードをUTF-8以外で送った場合に起こるはずです。

エンコードに関わらずHit数が少なくなるというのが>>236で示した別の問題です。
> ブラウザで検索した時は、同一サイトのリンクをカウントするのに対し、
> APIで検索した時は同一サイトのリンクは一つのみなので、結果が少なくなるそうです。

239 :nobodyさん:04/08/12 09:06 ID:BNPcYl+E
>>273
>>231のサイトには(Yahooの検索だけど)ブラウザと同じ結果が得られると書いてありましたが、
これはどうですか?

これは、YahooがGoogle APIsを使っていたと言う根拠にはなると思うけど。
>>236でいいたかったのは、http://www.google.com/search の方でした。




240 :nobodyさん:04/08/19 18:56 ID:Kc/QSXo3
ところで、1000クエリ超えたらどうなんの?
注意されて止められるのかな

241 :225:04/08/19 22:06 ID:???
>>239までで、HIT数が少なくなる原因

(1)Google Web Apisと、http://www.google.com/がそれぞれ違うデータベースサーバを
 持っているため(Google Web Apis用のデータベースは、量が少ない)
  →参考:http://www.goodpic.com/mt/archives/000132.html

(2)同一サイトのリンクをカウントの違いにより、Google Web Apisの方がHIT数が少なく見える
  →参考:>>236


(3)日本語で検索すると、正常に検索が出来ないため、HIT数が少ない
  →正常な検索結果では無いと思う理由:
   ・HIT数が極端に少ない(100分の1ぐらい)(参考>>232
   ・中国語など文字化けしたようなページばかりHITする(参考>>234>>227)
   ・上位に来るはずのページがHITしない(例:「2ちゃんねる」で検索しても上位にwww.2ch.netが来ない)(参考>>227)
 
  →予想される原因:
   ・EUC-JPで送っていないから?(>>228)
    →EUC-JPで送信しているプログラムの例>>230(これでも駄目)
   ・その他???

とにかく、日本語(他外国語も?)のエンコード周りでとらぶっている予感がする。

242 :nobodyさん:04/08/20 07:15 ID:OVDxpCAg
>>240
http://www.google.com/apis/api_faq.html#tech7
Google APIs (java)とかだったら 例外(GoogleSearchFault) が throw されます。

>>241
まとめありがとう。一点だけ訂正、EUC-JP ではなく UTF-8 ですね。

>>230 のコード
Jcodeはインストールされていなかったので、
エンコード処理を標準モジュールの Encode::from_to に変更して試したところ、
http://www.2ch.net/ が検索結果のトップに出ました。
2ちゃんの"2"は全角と半角の両方で試しましたが、どちらも同じ結果です。

EUC-JPで"2ちゃんねる"や"2ちゃんねる"を検索すると下のURLがひっかかりました、
検索上位に期待したサイトがこない、文字化けしたようなページばかりHitするって
こういう事じゃないのかな? UTF-8で検索している限りではこういう事は起こった事ないです
http://www.foundertech.com/Stock/%B7%BD%D5%FD%BF%C6%BC%BC%CD%B6%D7%CA%D5%DF%B9%D8%CF%B5%B9%DC%C0%ED%D6%C6%B6%C8.pdf
http://www.stopwar.org.uk/Resources/cairo2callpersian.pdf

(230のコードで追加/変更した箇所)

use encoding 'utf-8', STDOUT => 'euc-jp'; # consoleでテストしていた為
use Encode qw/from_to/;

my $word = shift(@ARGV); from_to($word, 'euc-jp', 'utf-8');
# snip
$search->query($word) ;



243 :nobodyさん:04/08/20 09:01 ID:???
Googleからもらったトークンを使ってアクセスするわけだけど、
CGIなんかにして検索フォームを設置するとか、専用アプリケーションにするとかした場合、
自分のトークンを埋め込まないといけないわけで、利用者が多くなれば
1000クエリ/日 の制限なんてあっという間に超えてしまいそうなんだが、どういうもんなんでしょ?

244 :nobodyさん:04/08/20 12:20 ID:OVDxpCAg
>>243
> 利用者が多くなれば
bata版は個人用途のみって事になってるので、これは規約違反になるんじゃない?
大抵のgoogle WEB APIs(beta)使ったデモは、利用者にkeyを入力してもらう形式になってるよ。

http://www.google.com/apis/api_faq.html#gen13
http://www.google.com/apis/api_terms.html

245 :nobodyさん:04/08/20 15:00 ID:???
>>244
なるほど〜。てことは、多くのgoogleを使って面白いことをしている検索サイトは
googleで検索した結果のHTMLを解析しているってことなんだね。

Amazonのはどんな規約だったんだろう

246 :nobodyさん:04/08/21 09:50 ID:Ws+CcWA8
>>245
1日1000クエリ内に収めているか、
商用だとしたら、前のyahooみたいにgoogleと提携してるんじゃない?

> googleで検索した結果のHTMLを解析している
これも商用目的の場合は禁止だったはず。
自動で送られてくる様なクエリーはチェックされているらしいです。

# Amazonは知らない。

>>241
追加情報。

Release Notes http://www.google.com/apis/release_notes.html
> Queries in CJK languages (Chinese, Japanese, and Korean) still do not work completely correctly. A future release will address these problems.

FAQより、最後の行 http://www.google.com/apis/api_faq.html#tech26
> The APIs still do not always return complete results for Chinese, Japanese, and Korean; we are working to remedy this issue.

APIsでは、日本語の検索は、まだ完全には対応されていない
ってことで結論になりそう?

CJKって事から察するに、恐らくエンコーディグの自動判別関連だろうけど、
これって "検索対象のサイト" が日本語/中国語/韓国語の場合、他の言語と区別出来ないって事かな?
検索する語のエンコードはUTF-8って指定されてるから、こっちは問題にならないよね?

247 :225:04/08/22 00:37 ID:???
>>241の"EUC-JP"は"UTF8"の間違い

>>242と同じように>>230を書き換えたが、
結果は>>230と全く同じ結果だった。

↓ソース
---
#!/usr/local/bin/perl
use SOAP::Lite;
use Net::Google;
use Encode qw/from_to/;
my $google = Net::Google->new(key=>'****************************************') ;
my $search = $google->search();
$word = "2ちゃんねる" ;
from_to($word, 'euc-jp', 'utf-8');
$search->query($word) ;
$search->lr("");
$search->starts_at(0);
$search->max_results(10);
$search->restrict("") ;
$search->filter(0) ;
$search->safe(1) ;
foreach $a1 ( @{$search->results()} ) {
print " URL ->" . $a1->{__URL}. "\n" ;
}

↓結果(上位5)
URL ->http://www.who.int/ifcs/Documents/Forum/ForumIII/f3-finrepdoc/Arabic/Annex1.pdf
URL ->http://www.who.int/ifcs/Documents/Forum/ForumIII/f3-finrepdoc/Arabic/MeetingSummary.pdf
URL ->http://www.who.int/entity/vaccine_safety/reports/ar/en/june2002_ar.pdf
URL ->http://www.who.int/entity/vaccine_safety/reports/ar/en/dec2002_ar.pdf
URL ->http://www.who.int/gb/ebwha/pdf_files/EB108/aeb108id2.pdf

248 :225:04/08/22 01:07 ID:???
つづき

で、本当にutf8で送信されているか8行目の後でチェックしてみた。
utf8で送信はされているはず
(参考:http://www.cybercom.co.jp/~mikio/other/tips/tips_contents.html
↓ソース
---
$enc = guess_encoding( $word) ;
print " QueryEnc -> " .$enc->name."\n" ;
print " Query -> " .jcode($word,'utf8')->euc ."\n" ;

↓出力結果
---
QueryEnc -> utf8
Query -> 2ちゃんねる


また、気になるのは、サーバから戻ってくるsearchQueryが、エンコード等が正しいのか怪しい
utf8で帰ってきているけど、それをEUCに変換すると、デタラメな文字列になる・・・
↓ソース
---
print " returnQueryEnc -> " .$enc->name."\n" ;
print " returnQuery -> ".jcode($r->{__searchQuery},'utf8')->euc ."\n";
$enc = guess_encoding( $r->{__searchQuery} ) ;

↓出力
---
returnQueryEnc -> utf8
returnQuery -> 羨・・〓束〓〓・・・〓〓・・


249 :225:04/08/22 01:08 ID:???
これらから原因予測すると
 ・そもそもGoogle Web Apisは日本語検索に対応してない
 ・$search->query以外のパラメータが影響している
という辺りか?

>>242は日本語検索できるが、>>247は出来ないとなると、
perlのバージョンやらSOAPLiteのバージョンやらOSやらの環境の違いが影響しているのじゃないかと
疑った方がいいのやろうか?

>>242は正常に検索できているのに、「APIsでは、日本語の検索は、まだ完全には対応されていない(>>246)」
で片付けるのはなんかしゃくだな・・

どこか私の設定等が悪いのだろうか?

自分でさらに調べるとすると、流れてるパケットの>>242内容の違いを調べて見たい。。
(それが近道だと思ったりする)(ただ、>>242さんが協力してくれれば)

250 :225:04/08/22 01:15 ID:???
>>246
ところで思ったんだけど
商用のgoogle web apisって存在するの?

少なくともyahooと連携しているのは、SOAPは使ってないと思う。
(何か別のプロトコルを使ってるんじゃないかと思った)

理由:SOAPは遅いから
(一度httpを通さないと行けないし、
わざわざhttp以外を使ってまでSOAPを使うのだろうかと、疑問に思った)


251 :242:04/08/22 13:44 ID:+ndPVteA
>>249
Debugするなら Net::Google->new( key => "...", debug => 1 ) で
HTTPのメッセージが出力されますよ。

utf-8 -> euc で化ける件は、
utf-8の文字列がそもそも日本語でない(EUC-JPの範囲外)場合に起こりそう
一度、hex dumpしてみては?

>>250
http://www.google.co.jp/intl/ja/terms.html
商用利用したい場合は、あらかじめ Google と契約を結ぶ必要があるそうです。

SOAPの通信レイヤの実装はHTTPだけとは限らないので、
また、HTTPでもチューニング次第で多少のパフォーマンス改善は出来る。(keep-aliveにして接続をプールする、等)
逆に保守とか普及コストの面からSOAPを選択。って主張もあり得るんだし、
非公開部分の実装までは、ちょっと部外者にはわからないんじゃないかな...
# APIsが異なるデータベースを持っているというのも、調べた限りでは殆んど噂レベルの推測

さすがに、通常のhttp(1queryで1接続)ではないと思うけどさ。

252 :242:04/08/22 13:46 ID:+ndPVteA
参考までに、うちのperl環境です。(consoleで入力/表示 共に EUC-JP)

% perl -v
This is perl, v5.8.2 built for i686-linux
...

% cat chkvers.pl
#!/usr/bin/env perl
for (@ARGV) {
my $file = $_; $file =~ s|::|/|g;
if (require "$file.pm") {
import $_; printf("%-20s\t%s\n", $_, (VERSION $_));
}
}

% ./chkvers.pl Net::Google Net::Google::Service Net::Google::Search SOAP::Lite XML::Parser Encode
Net::Google 0.61
Net::Google::Service 0.4
Net::Google::Search 0.5
SOAP::Lite 0.60
XML::Parser 2.34
Encode 1.9801


253 :225:04/08/29 00:08 ID:???
>>251
最近多忙につき、今度試してみます

254 :nobodyさん:04/09/26 17:35:58 ID:???
>>253は、まだ多忙なのか。1ヶ月待ってるんだが。

255 :253:04/10/03 13:22:55 ID:???
>>254
ごめん
しばらく多忙です。。

256 :253:04/10/03 13:28:21 ID:???
お詫びと言っては何だが、これを

GoogleのHIT数の推移
http://iroha.club.kyutech.ac.jp/mrtg/iroha_google_1.html
http://iroha.club.kyutech.ac.jp/mrtg/iroha_google_2.html

65 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)