2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

検索エンジンをつくりたい

1 :yam ◆AyW.Rdbg :01/12/22 23:16 ID:???
ヤフーのような検索エンジンを作って、
自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。

2 :名無しさん@お腹いっぱい。:01/12/22 23:26 ID:???
>>1
スゲー面白そうじゃん、俺も参加しよ!!!!
みんなもやろーぜ!!!!!!!!

3 :名無しさん@お腹いっぱい。:01/12/22 23:28 ID:w+4+eLNd
イメージしているものが良く分かりませんが、
いまさらYahooでもないでしょう。

とりあえず、全文検索についての技術動向は
こちらが手軽にまとまっています。
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html

4 :名無しさん@お腹いっぱい。:01/12/22 23:28 ID:???
本気?
あんなの利用するのネット暦半年未満ぐらいの人だよ?
いまさら同じアイデアで成功するとでも思ってるの?

5 :名無しさん@お腹いっぱい。:01/12/22 23:33 ID:???
>>2
で、なんで>>1と同じメールアドレス?(w

6 :名無しさん@お腹いっぱい。:01/12/22 23:34 ID:1geb76gF
出来合いのロボットプログラムあるんじゃないの?
開発費用は有能なプログラマを捕まえられるかどうかにかかってる。
有能なヤツつかめば驚くほど早くできるが
無能なヤツつかむとどれだけ人数と時間をかけてもはかどらん。
ま、有能なヤツは給料もタプーリ払わないとだめだけどね。

7 :yam ◆AyW.Rdbg :01/12/22 23:35 ID:???
さっそくありがとう。
>>4さん
まさにそのとおりなんだけど、
あんなの利用しにくいから、つくってしまえ、と。
アイデアを話せば、なるほど、と思われる(あるいはひとりがてんと
笑われるかもしれないけれど)、
うまくいけば、第二のヤフー(大金持ち)も夢ではない
と思っています。

>>3さん
じっくり読んでみます。ありがとう

8 :yam ◆AyW.Rdbg :01/12/22 23:36 ID:???
>>6さん
僕も不思議です。
>>2さん。人のメルアド使わないでね^^

9 :yam ◆AyW.Rdbg :01/12/22 23:37 ID:???
8の
>>6さんは
>>5さんの誤りです。^^

10 :10:01/12/22 23:45 ID:???
>>1さんかっくいー!!

11 :名無しさん@お腹いっぱい。:01/12/22 23:58 ID:???
1さん完成したらぜひ使わせていただきます!!
みなさん協力してあげてください!!!!

12 :yam ◆AyW.Rdbg :01/12/23 00:01 ID:???
ちなみに僕はWEB界の人間ではなく、編集者(出版)。
画面という誌面の中で、
どういう工夫を施せば、もっと使える検索サイトになるかを、
(言い方は悪いけれど)
アメリカのWEB製作馬鹿(=別にヤフーをいっているわけではありません^^)
よりは、知っていると思います。

仕事がら検索サイトでの検索をよく利用するけれど、
「なぜ、こんな馬鹿な検索サイトをつくる!!」と日々怒っています。
それならつくってしまえ!と。
コネもなく、技術もなく、お金もない・・。
だから、まずは2chで、現状やご意見、我こそは、という人を探してみたいと思ったわけです。

13 :名無しさん@お腹いっぱい。:01/12/23 00:07 ID:???
>コネもなく、技術もなく、お金もない・・。
じゃ、ムリ

14 :名無しさん@お腹いっぱい。:01/12/23 00:08 ID:???
素人に出来るものではない

15 :yam ◆AyW.Rdbg :01/12/23 00:16 ID:???
>>13さん
>>14さん
だと、思います。だけど、そういってあきらめては、何も前進しない。

希望は、といえば、僕の考えに賛同してくれて、
成功を信じてプログラムをつくってくれる(成功報酬で。つまり失敗すれば無償)
優秀で奇特な人を探したい・・というのが本音かな。
そんな人がいたらメールください。
会って話しましょう。

16 :名無しさん@お腹いっぱい。:01/12/23 00:19 ID:???
あのクラスのサーチエンジンはそういうレベルで作れるものじゃない

17 :名無しさん@お腹いっぱい。:01/12/23 00:23 ID:???
んー。アプリだけだったらGPLでつくれるかもだけど。
運用は、まず無理だろなー。金がないと。

18 :yam ◆AyW.Rdbg :01/12/23 00:24 ID:???
>んー。アプリだけだったらGPLでつくれるかもだけど。
>運用は、まず無理だろなー。金がないと。

その運用のお金っていくらぐらいなんでしょうか?

19 :yam ◆AyW.Rdbg :01/12/23 00:31 ID:???
アプリさえつくれて、それが評価されれば、
買い手(運用者)はいくらでもいると思っています。
評価されなければ、実際に運用しても仕方がない。
運用は、評価のための、最小限の運用でよいと思っています。

20 :名無しさん@お腹いっぱい。:01/12/23 01:06 ID:???
結論。
>>1に技術が無ければ無理。

21 :名無しさん@お腹いっぱい。:01/12/23 01:10 ID:???
> 画面という誌面の中で、
> どういう工夫を施せば、もっと使える検索サイトになるかを、
> (言い方は悪いけれど)
> アメリカのWEB製作馬鹿(=別にヤフーをいっているわけではありません^^)
> よりは、知っていると思います。
出版系の人って紙の印刷物での手法をwebにも持ち込もうとするけど、
単にあなたがweb系の表現方法に慣れてないというだけのことはない?

22 :yam ◆AyW.Rdbg :01/12/23 01:25 ID:???
>>21さんへ
web系の表現方法ではなく、考え方です。
使う側の立場に立った、
検索サイトのあり方を問題にしています。
けっして表現の部分ではありません。

また、「web系の表現方法に慣れる」という、
習熟を利用者に強いるようなコンテンツは、そもそも最悪と考えています。

23 :名無しさん@お腹いっぱい。:01/12/23 01:39 ID:???
その利用者ってのにもレベルの差がある。初心者向けの
コンテンツは大抵パワーユーザーには無視される。
単純に、「わかり易いもの」=「良いもの」じゃない。
どんな「使う側」の立場に立つつもりかは知らんけどね

24 :名無しさん@お腹いっぱい。:01/12/23 02:18 ID:???
> また、「web系の表現方法に慣れる」という、
> 習熟を利用者に強いるようなコンテンツは、そもそも最悪と考えています。
何をするのにもある程度の習熟は必要だと思うけど。
自転車に乗るのには習熟が必要だけど、サイクリングロードなんかの施設は最悪?

25 :名無しさん@お腹いっぱい。 :01/12/23 02:27 ID:???
>使う側の立場に立った、・・・・
これは世の中の初心者さんの事を言ってるんか?
それとも、自分の事? つまりこう言う事?
「車を買ったが、こんなにスイッチが有るのは大変なので車を作ろうと思います。
因みに、僕は八百屋をやっていて無償で手伝ってくれる人を探しています!!」

・・・・無理! あきらめろ

26 :名無しさん@お腹いっぱい。:01/12/23 02:30 ID:aSYtfI1G
とりあえず論文あさって、目をつけた研究者に直接会って話するのが一番はやいと思う。
(本気でやるなら)

27 :名無しさん@お腹いっぱい。:01/12/23 02:34 ID:???
雑誌はハイパーリンクが無いしダウンロードできないから不便だなぁ(w

28 :名無しさん@お腹いっぱい。:01/12/23 02:47 ID:???
夢多き厨房ですか (笑
各アルゴリズム本小一年位読めば、何とかなると思うよ

29 :名無しさん@お腹いっぱい。:01/12/23 02:59 ID:SWcGUWvj
>>1
君よりかしこい人たちが沢山お金と時間をかけて検索エンジンってのは開発、管理、運用されているんだよ。

30 :名無しさん@お腹いっぱい。:01/12/23 03:41 ID:???
そもそも、「Yahoo!みたいなの」という場合はロボット型検索エンジンでは
なくてウェブディレクトリを言うのだが。今ではYahoo!もportalの一貫として
検索サービス(今はgoogle)へのゲートウェイも提供しているけどね。

31 :名無しさん@お腹いっぱい。:01/12/23 12:29 ID:1kn+Hw33
技術未満というか、要件定義未満の話だろ。
技術なんて目的が伴って始めて意味もつんでさ。
何のために検索するのかとか、考えたこと無いでしょ?

32 :名無しさん@お腹いっぱい。:01/12/23 13:51 ID:???
私が馬鹿だからでしょうか?
「ヤフーのような検索エンジン」の意味が分かりません。
「ヤフーレベルの検索エンジン」という意味でしょうか?
「ヤフーのような」ならゼロ円でききるし、「ヤフーレベル」なら
サーバー管理・費用など含めて100万200万の話じゃないような気もしますが。
そもそも現状Webの世界では技術開発よりも運用ポリシーの方が大事で、
まずそれを決めてから既存の技術をどう組み合わせるかを考えます。
それにヤフーは検索エンジンだけでなく様々なコンテンツとのシナジーで
さらに集客があがり、その結果商用(広告)として成り立ってます。
つまり、1>さんは何がしたいのですか?

33 :名無しさん@お腹いっぱい。:01/12/23 14:32 ID:???
検索エンジンなんて普通はサーバー代で億単位だぞ。
素人が採算の見こみもとれずにやっていけるところじゃない。
あと自作自演はすぐに分かるからやめてくれ。

34 :名無しさん@お腹いっぱい。:01/12/23 15:59 ID:???
1はバカです
例えるなら1はロックが好き、そこで張り紙を出した
有能なバンド仲間募集しています、私は何もできません。


                      あほ

35 :名無しさん@お腹いっぱい。:01/12/23 19:17 ID:9yh03zgW
>>34
極端過ぎるよアホ

36 :名無しさん@お腹いっぱい。:01/12/23 20:31 ID:???
そう?結構良い例えだと思ったけど。
どうせならGoogleみたいな検索エンジンを作ってくれよ>>1

37 :クソレス:01/12/23 23:45 ID:???
>>34に同意
できるなら黙ってやれ

38 :名無しさん@お腹いっぱい。:01/12/25 19:32 ID:???
これが噂の「あれ」を指摘した人が負けなスレですか?
5,33氏は早速死亡ですか。

#ひさびさの本物電波か中坊に出会って少々興奮してます、私

39 :名無しさん@お腹いっぱい。:01/12/25 19:59 ID:q4MWoNT+
面白そう。AGE

40 :名無しさん@お腹いっぱい。:01/12/26 12:40 ID:???
わーい

41 :名無しさん@お腹いっぱい。:01/12/26 18:26 ID:???
わーい

42 :名無しさん@お腹いっぱい。:01/12/26 20:54 ID:???
ていうか、検索エンジン作っても今さら人が集まらないのでは?
スパムメールでも送りまくるのか?(w

43 :名無しさん@お腹いっぱい。:01/12/27 09:03 ID:???
>>42
Googleを超えるの作れば集まるだろうよ。
>>1には無理だが。

44 :名無しさん@お腹いっぱい。:01/12/29 18:59 ID:???
ネタにマジレスだけど、、

>>1よ。
個人の要求に応じて日々ネットを飛び回って、
要求に合ったWebを発見したら通知してくれる
「エージェント」を作ってくれ。

※技術的に極めて難しいのは承知の上。

45 :nobodyさん:02/04/19 03:03 ID:???
    d_b    / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
              (  ゚曲゚)  < 日下部は俺一人でいい…!
             /⊂彡Vミつ   \_________
             |_ζ<O> ζ
              (_)_)

46 :名無しさん:03/01/03 01:26 ID:???
            / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
Λ_Λ  | 君さぁ こんなスレッド立てるから          |
( ´∀`)< 厨房って言われちゃうんだよ             |
( ΛΛ つ >―――――――――――――――――――‐<
 ( ゚Д゚) < おまえのことを必要としてる奴なんて         |
 /つつ  | いないんだからさっさと回線切って首吊れ     |
       \____________________/

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)


47 :nobodyさん:03/01/03 23:29 ID:qJ+hUpKo
>>12
この人が作った雑誌を見てみたい。
勘違い糞雑誌(社)のなんと多いこと。
中途半端に出てくるくらいなら一生紙にしがみ付いてろ。

48 :山崎渉:03/01/15 13:36 ID:???
(^^)

49 :nobodyさん:03/02/02 07:36 ID:???
みえみえの自作自演する寒い1には何やっても無理。w

2 :名無しさん@お腹いっぱい。 :01/12/22 23:26 ID:???
>>1
スゲー面白そうじゃん、俺も参加しよ!!!!
みんなもやろーぜ!!!!!!!!




50 :検索エンジン占い:03/02/22 06:00 ID:UEOb4JQU

http://www.fm8283.sakura.ne.jp/um/view?id=2048

51 :山崎渉:03/03/13 17:13 ID:???
(^^)

52 :山崎渉:03/04/17 12:24 ID:???
(^^)

53 :山崎渉:03/04/20 06:09 ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

54 :t-akiyama:03/05/20 17:55 ID:???
携帯ゲーム機"プレイステーションポータブル(PSP)

 このPSPは、新規格UMD(ユニバーサルメディアディスク)というディスクを利用しており、そのサイズは直径6cmととても小さい(CDの半分程度)。 容量は1.8GBとなっている。
画面は4.5インチのTFT液晶で、480px x 272px(16:9)。MPEG4の再生やポリゴンも表示可能。外部端子として、USB2.0とメモリースティックコネクタが用意されているという。

この際、スク・エニもGBAからPSPに乗り換えたらどうでしょう。スク・エニの場合、PSPの方が実力を出しやすいような気がするんですが。
任天堂が携帯ゲーム機で圧倒的なシェアをもってるなら、スク・エニがそれを崩してみるのもおもしろいですし。かつて、PS人気の引き金となったFF7のように。

55 :山崎渉:03/05/22 02:11 ID:???
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

56 :山崎渉:03/05/28 17:15 ID:???
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

57 :nobodyさん:03/06/24 04:27 ID:GbEoFmir
ここで人気No.1のAV女優、及川奈央のオマ○コが見れました!!
うぉぉぉぉぉぉ!!!!素晴らしい!!!(*´Д`*)ハァハァ
http://plaza16.mbn.or.jp/~satchel/oikawa_nao/

58 :山崎 渉:03/07/15 11:11 ID:???

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄

59 :山崎 渉:03/08/02 02:40 ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

60 :ぼるじょあ ◆ySd1dMH5Gk :03/08/02 05:24 ID:???
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ

61 :山崎 渉:03/08/15 22:53 ID:???
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

62 :nobodyさん:04/02/19 20:28 ID:K/zLomxJ
関連スレ

【求む!】ロボット検索エンジンのprog【教えて!】
http://pc2.2ch.net/test/read.cgi/php/1009507473/l50

検索エンジンつくりたい
http://pc2.2ch.net/test/read.cgi/php/1063529003/l50

YomiサーチPHP化プロジェクト
http://pc2.2ch.net/test/read.cgi/php/1044371877/l50

63 :nobodyさん:04/02/19 20:32 ID:???
まことに勝手ながら、本日を持ちましてこのスレは
検索エンジン製作に関するスレになりました。

64 :nobodyさん:04/02/20 04:34 ID:???
マジで検索エンジン制作の話題したいんだが

PHP+MySQLでヤフー式の簡単な検索エンジンを制作する場合
どのくらいのアクセス数、登録数に耐えられると思う?

65 :nobodyさん:04/02/20 07:48 ID:+ZtOPAr+
リンク集をhtmlで作って、googleのサイト内検索窓でも付けれ(藁

66 :中の人:04/02/20 09:10 ID:2ykvpncx
>>64
どんなマシンを何台使うかによるよ。
あと、検索精度にどの程度こだわるかにも。
フレイズ検索は不要と割り切ればMySQLでもそれなりにスケールするだろう。

67 :nobodyさん:04/02/20 12:31 ID:???
>>64
俺同じようなのPerl+Accessで作ったけど
Accessでも10万件くらいはいけるんじゃないの?
とか楽観的に考えてる。

68 :nobodyさん:04/02/20 15:18 ID:pO9W6gy/
>>66
例えばマシンはレン鯖によくある下記のスペックだとする

OS:RedhatLinux
CPU:Pen4 2.4GHz
RAM:1GB
HDD:120GB×2(RAID)
回線:光100Mbps

俺としてはYomi-searchほどあれこれ機能がついてなくてもいい。
用は検索の鮮度を上げることと、下位に位置するページも
見やすいような作りを望むわけだ。下位ページが悪いわけじゃないし。

>>67
個人、(もしくは中小)規模の人間が数人でせっせとやったところで
現状、大手の検索エンジンがある以上、数年でせいぜい10万件が限度だと思う。
と考えると、問題は数より中身で勝負なわけで。
検索スピードは最低でもYAHOOやGoogleと同レベルにする必要はある。
そして+αの機能。ランキングやアクセス数以外の面で何かユーザーにとって
”使いやすい”機能を提供しなければならない。

69 :nobodyさん:04/02/21 19:46 ID:???
せっかく議題出してるのに返事ねーよ・・・鬱

70 :中の人:04/02/22 12:19 ID:n4Z2WSBu
それぐらいのマシンだったら、10万件のっけたとして、
1日10万アクセスぐらいは楽にこなすと思う。
MySQLで作っても大丈夫でしょう。
+αの部分がどれだけの計算量を必要とするかにもよるが。。

71 :nobodyさん:04/02/22 12:48 ID:???
>>68
個人でサイトの登録なんかしないよ。無断リンクで怒られるし。
サイト管理者に登録してもらうんだよ。

72 :nobodyさん:04/02/22 16:40 ID:???
>>70
なるほど。あとは+αの部分だな。。RSSを絡めるのもいいとは思うし
アマゾンみたいに自分にあったサイトを抽出するような機能を
出せるのもいいとは思うが、それだとかなり大変そうだしな・・。

>>71
書き方が悪かった。個人や小規模の場合、YAHOOやGoogleなどの
組織と比べて動ける範囲や予算も知れてるだろうって事。
リンク獲得も人や金がいるだろうしね。

73 :nobodyさん:04/02/22 23:54 ID:???
検索エンジンで食っていけるかな?

74 :nobodyさん:04/02/23 00:58 ID:???
>>73
単なる検索エンジンなら無理だと思う。
上でもあるように+αの効果が無いと。

75 :nobodyさん:04/02/23 15:51 ID:???
>>74
大した機能なくても(Yomi-Search使ってたり)ジャンルを特化したり
すれば結構人が来てるサイトもあるよ。

76 :nobodyさん:04/02/23 19:15 ID:XTMpAAWU
>>75
俺としては基本的にYomi-Searchほどの機能は無くてもいいと思う。
特にランキング関係はサイトの差別化になり、良くないし。
だからYAHOO!のように地味でもキーワードにあったサイトを出すのが一番だろうね。
あとはジャンル化。Googleで検索しても目的のキーワードで拾えない
事が多々あるから専門分野に特化した検索エンジンなら効果あるかもね。

例えば野球の検索エンジンで試合結果をすばやく更新した
サイトを検索結果で上位に持ってくるとかね。
サイトのupdateの時間と野球の大体の試合時間を予測(もしくは手動で観察)
する必要があるけど、野球を見逃した人なんかは試合結果を気になって検索するしね。

77 :nobodyさん:04/02/23 22:35 ID:???
>>76
それだけ見るといわゆる「アンテナ」でいいじゃんって感じがする。
野球系の役に立つサイトを100個ぐらいあつめてアンテナに登録して
おけば>>76に書いてあることは実現できるよね。

俺は「検索はアバウトだから良い」と思っているのでそういう特化した
検索エンジンはいらない。むしろ多少外れた内容がたまにあるから知識
が深くなることも多いと思う。
ところがたまに外れ過ぎるときがあるのと、ピンポイントでの検索を
行いたい時に困る。

あ、これ書いていたら良い方法が思い付いたかも…。





78 :nobodyさん:04/02/23 23:48 ID:???
>>77
カテゴリ分類されたロボット検索エンジン?

79 :77:04/02/24 00:24 ID:???
>>78
いや、『方法が思い付いた』と言っても何かアルゴリズムが思い付いたとか
ではなくて『もし、こんなことが可能なら理想に近くなるかも!?』と思った
程度の話。

しかも、紙に書きながら考えをまとめようとしているが、まったくまとまらん。

とりあえず、検索エンジンだけで成り立つシステムではないなぁ。
ってか自分でもよくわからん。



80 :nobodyさん:04/02/24 00:51 ID:???
>>77
なるほど。例えば商売にするわけじゃなくてもはやりそれなりの反響は欲しいわけで
機能を限定したユーザーだけが利用するような検索エンジンを作っては
範囲がかなり狭まるからね。

俺もなんとなく”イメージ”は沸くんだが、なかなか口に出していえない。
ようはサイトに登録する人・観覧する人双方それぞれが得をして
その仕組みによってインターネットを活用する人が更に増えればいいんだけどね。
今は誰でもどんなページでも検索エンジンに登録できて
「野球」というキーワードで検索しても野球のサイトが出なかったりするし
それぞれ目的が違うしね。(試合結果を見たいのか、大リーグの応援サイトを見たいのか等)

と↑を書いてたら俺も微妙に浮かんではきてるんだけどねw

81 :77:04/02/24 01:33 ID:???
>今は誰でもどんなページでも検索エンジンに登録できて
>「野球」というキーワードで検索しても野球のサイトが出なかったりするし
俺は違うと思う。
あくまで検索エンジンはできる限り多くのデータを持っているべきで、それを
『どのように』選ぶかで悩むべきだと思うんだ。

今何となく思っているのは
『野球についての良いサイトを見つけたかったら、野球について良く知っている
人に聞くのが1番』だということ。

ほんと、よくわからん(藁


82 :nobodyさん:04/02/24 05:07 ID:UjHo5qOk
>>81
『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
俺が感づいてないだけならすまん。。

>『野球についての良いサイトを見つけたかったら、野球について良く知っている
>人に聞くのが1番』だということ。

そのデータの”取捨て”が難しいわけで。データ量が多い=野球に詳しいってわけでもないし。
上でも書いたけどいくら検索エンジンが多くのデータを持つことが大事だとはいえ
”正確さ”ってのが大事なわけで。GoogleとYahooと比べて正確さなら明らかにYahooなわけで。
なぜなら人が見てカテゴリを判断してるからね。

俺も自分の話で悪いが「正確さ」を求める時はYahooでカテゴリ検索する。
上の例で言うと野球の有名な(情報量の多い)サイトを探したい場合、Yahooならあるが
Googleの場合、違うサイトが引っかかる場合があるからだ。漠然とキーワードが定まらない
場合はGoogleはいいけど、ある程度目的が決まっている場合はYahooになる。

このYahooの”正確さ”を手動ではなく自動で解析できるようになるといいんだけど
単にhtmlのtitleやmetaタグの文字を参考にするだけでは正確さが出ないしね。
なぜなら登録時に偽りのデータを書けるわけだし。

83 :77:04/02/24 05:36 ID:???
>>82
>『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
>俺が感づいてないだけならすまん。。
伝わらない? ごめん
要するに『どんなページでも登録できる』ことが『目的のキーワード
の検索結果を濁らせる』わけではないと思う、ということ。

どんなページでも登録できて、かつ良い検索結果を出すのが理想だよね。

今考えている方法だとデータの取り捨ては重要ではなさそう。

もしも、もしもだけど、Google利用者が毎回各検索結果に対して
得点付けをしたらどうなるだろう。
それで、利用者はGoogleに対して『野球が好きな人が付けた得点のみを
採用』するように設定する。正の得点も負の得点も(つけてないものは0かな)。

言い方を変えると「野球好きな人が良いと判断したサイト」に重みを
かけるようにする、ということ。

問題は大きく分けて二つ。
1. 得点付けなんて面倒なことしたくない(しかも自動化は難しい)
2. どのユーザが野球好きかなんて分からない

この両方が解決したら、楽しそうだよね。
一応頭の中では解決しているのだけど、別の問題が多々…。


84 :nobodyさん:04/02/24 06:46 ID:UjHo5qOk
>要するに『どんなページでも登録できる』ことが『目的のキーワード
>の検索結果を濁らせる』わけではないと思う、ということ。

なんとなく分かった気がするw

で、77の新提案だがそれはYahooのレビューサイト(本とかCDとか)を見ると答えが出ると思う。
あそこは2ちゃんからの荒らしが多いのか、めちゃくちゃだw
それに自分の検索結果だけを投票するようなスパム行為も行われることだろう。

俺が一番、検索システムで改善して欲しいポイントが「新規サイト」に関してだ。
Googleでも最近、登録されたサイトは上位にくる傾向にあるようだが
基本的に1ページ10サイト(Yahooなら20?)しか表示されないわけで
どう考えてもやったもん勝ちの新規参入がしにくい。

まぁ、実店舗と比較すると実店舗も中々大手には勝てないから地道にするしかないんだけど
ネットだとその差が激しいと思って。実店舗だととりあえず「新規開店時の優遇」があるけど
ネットの検索エンジンだとあまり効果が無い。まぁ、Yahooぐらいなサイトになると
新着サイトに載るのは効果があるけど、Yahooは手動だから論外なわけで・・。

何がいいたいかというともっと新規参入者が参入しやすい体制を作れないかな?と思うわけ。
そしてネットを数ヶ月していて毎回同じサイトばかり見ている人に
「こんなサイトが新しく出来ましたよ〜」っていう良い方法がないかな?と思って。
両方、提供する側・される側にとっても有益になると思うし。

うまくかけなくてごめん。。

85 :nobodyさん:04/02/24 06:58 ID:???
暇だからもう少しsageで書くw

いくつか手段を考えているがどれも解決しない。。

・ユーザー登録したユーザーに新着サイトを随時メールする
→うざがられてほとんど見ないと思う。

・検索するたびに新着サイトを表示
→限られている画面上では検索結果の情報と比べて限界がある。

・検索するたびに毎回表示されるサイトを変える(ランダム表示)
→検索エンジンの信頼性を欠く

・アクセス数、アップデート回数、投票数などで順位を決める
→不正が可能だし、cookieで制御しても数的に新規参入はなかなか上がれない

86 :nobodyさん:04/02/24 07:41 ID:???
んーでもできたばかりのサイトに情報価値はないでしょ。

87 :77:04/02/24 14:16 ID:???
>俺が一番、検索システムで改善して欲しいポイントが「新規サイト」に関してだ。
>>86が言う通り新しいサイトだからといってみる価値があるとも限らないよね。
でもこれが「新規ページ」ということならば同意。
単純に「過去一か月にアップされたページ内から検索」ができたら面白いかも。
「新規ページ」はリンクもあまりされていないからなかなか上位に入りにくいからね。

>・検索するたびに毎回表示されるサイトを変える(ランダム表示)
これは*うまくいけば*面白いと思うけどな。
Googleにランダム用のボタンでも作っておけば楽しいかもしれない。
というかこれならGoogle APIで実現可能(シンプルな方法ならば)。

話は変わるけどGoogle APIってどれくらい利用されてるんだろう。
俺は.NET使えないから、使うとしたらJavaかぁ。
最初はGoogleのデータベースを利用して形にしてみるのも良いかもな。

88 :nobodyさん:04/02/24 18:21 ID:D2PfXOG1
検索エンジンの3つの答え

・カテゴリ型検索エンジン
・ロボット型検索エンジン
・人力検索エンジン

89 :nobodyさん:04/02/24 20:45 ID:???
http://avbb.net/

90 :nobodyさん:04/02/24 22:18 ID:???
そういえば、人力の結果がまだこない。
何検索したかも覚えてないぞw

91 :nobodyさん:04/02/24 23:11 ID:???
検索結果の表示にもいろいろとパターンがあるけど、どれが一番いいんだろ?
通常は

「サイト名」登録日
サイトに関する情報

で、Yomi-seachなら前にバナーを表示させたり、クリック数を表示させたりできるわけで。
”バナー”って個人サイトなんかだとそのサイトの色を示せるから結構、楽しいんだけど
逆に安っぽさがあったり、表示に時間かかったりするわけで。
かといって単に文字だけ表示だと文字に埋もれて醜いわけで。(電話帳のごとく・・。)

表示方法もそうだけど、表示件数も難しい。1ページ10件ぐらいが妥当だと思うが
逆にそれだと上位数ページしか見ないという問題も出てくるし・・。

検索結果の表示法ほうってのもかなり重要な気がする。

92 :nobodyさん:04/02/24 23:24 ID:???
もうサーチエンジンなんかいらねえよ
余計なもんがひっかかるだけだからやめろ

93 :nobodyさん:04/02/25 01:15 ID:???
>>91
一つだけ言えるのは検索結果の表示にバナーは必要ない。
バナーなんてサイト運営者のエゴ以外の何者でもない。
検索する人の立場になって考えましょう。

Yomi-Searchの作者は利用者への配慮に欠けてる。
検索結果の画面も見にくくてしゃーない。

94 :nobodyさん:04/02/25 01:23 ID:???
Yomi-Searchの作者はNET CRUISERの検索結果表示を見習え。
http://www.kent-web.com/pubc/navi/cruiser.cgi

95 :nobodyさん:04/02/25 02:18 ID:???
>>92
例えば本屋のサイトを作る時の検索システムでもいるじゃん。
別にYahooやらGoogleに対抗する為だけにあるわけじゃないし。

>>93
確かにそうだな。「面白い」と感じることがあっても見る人の立場には立ってないし。

なんしか、良い表示方法は無いかな・・。

96 :nobodyさん:04/02/25 02:25 ID:???
>>95
検索結果の表示はシンプルイズベストだと思うけどね。
「サイト名」登録日
サイトに関する情報
で十分だと思うけどねぇ。

関係ないけど最近見つけたアイデア検索エンジン
http://web-pasha.com/

97 :nobodyさん:04/02/25 02:33 ID:???
>>92
あるジャンルに特化した検索エンジンって必要だと思うよ。

例えば飲食店の検索エンジンがあったとして、最寄の駅、
扱ってる料理の種類、営業時間などを指定して検索できるとする。
これらはGoogleやYahooでは検索しきれないものだと思うんだよね。
(YahooにはYahooグルメとかあるけどね)

あるジャンルに特化した検索エンジンを作るというのは
検索エンジン戦国時代の今を生き抜く一つの手だと思う。

98 :nobodyさん:04/02/25 02:37 ID:???
>>96
そこいいね。実用向きかどうかは別にしてなんか面白い事してる。
そういえば、gooが3D検索みたいなのをはじめたっけ。あれと似てるな。

>検索結果の表示はシンプルイズベストだと思うけどね。
>「サイト名」登録日 サイトに関する情報 で十分だと思うけどねぇ。

確かに”十分”なわけだけど、なんか”物足りない”んだよね。
文字がただ並んでいるだけでは電話帳と変わりないし
サイトの説明文だけ見ても内容は開くまで分からないわけで
いまいち、合理性に欠けるというか。といいつつ、一番いいことは確かだけどね。。


99 :nobodyさん:04/02/25 03:56 ID:???
>確かに”十分”なわけだけど、なんか”物足りない”んだよね。
凄い分かる、十分だけど十二分じゃないんだよね。

でも同時に思うのは、検索エンジンはそれ自体は所詮ツールだから
変な個性よりも直感性が大事ってこと。

Kart00:http://www.kartoo.com/

これなんかは面白いけど、どう考えても実用的ではない。
俺はGoogleみたいな表示形式でもう少しサイトの要約が多く表示されると
うれしい。それこそ今の倍ぐらいの要約テキストがあってもいいぐらい。

それこそ2chブラウザで「>>1」の上にカーソル乗っけた時みたいに、サイト名
の上にカーソル乗っけるとサイトの全文(または一部)がポップアップするような
機能が欲しい。


100 :nobodyさん:04/02/25 06:51 ID:???
>>99
タイトルにマウスを載せたときに2chブラウザの要約みたいに
せめてmetaの内容でも出ると面白いね。

でも、そうなると基本的にはIE(ブラウザ)に依存するわけだから
プログラム的にはどうしようもないけどね。
Javascriptを使ってマウスオーバーにしてポップアップを表示して、とか出来そうだけど
これだとちょっと話が変わってくるし。。

101 :nobodyさん:04/02/25 10:55 ID:???
じゃあいっそのこと検索結果の表示をFlashで作っちゃうとか。
Flashの普及率は良いと言われているし、好きなUI実装できるよ?

102 :101:04/02/25 10:57 ID:???
Flashは>>99のサイトで使ってたみたいね。

103 :nobodyさん:04/02/25 17:39 ID:zi0n15ep
FLASHは実際、嫌われているからね。。
今後も復旧するだろうけど、見る人の立場になるとどんなもんかと。。
(TVCMの動画とか3Dが決して評判がいいわけじゃないのと同じで。。)

なんしか、「早い」「見やすい」「わかりやすい」
検索システムが必要なわけで。それもジャンルに特化した。


104 :nobodyさん:04/02/25 18:00 ID:???
グーグルで複数キーワード使って引っかけるのより効率良くないとなぁ。

と思うとなかなか難しいもので。

105 :nobodyさん:04/02/25 18:07 ID:???
FLASH使っちゃうとどうしても飛び道具になっちゃう。
本気で何かを探そうとしている時に「FLASHロード中…」なんてメッセージ
みたくないよね。

ジャンルに特化するのは良いと思うけど、特化しにくいジャンルはどうすればいい?
本や映画などのようなものは良いけど、「検索エンジン アルゴリズム」みたいな
キーワードで検索したい時はジャンルは何? 「プログラム」ってジャンルは広すぎる
し、「検索エンジン」じゃ狭すぎる。

こういう時にどうしても「オールジャンル」な検索エンジンが必要になる。

それはともかく…
Google APIを使ってGUIな検索ツールっていうのはどうだろ?
ブラウザ密着でなくなるから使いにくくなるかな?

おまけ:http://www.mamma.com/index.html(以外といい感じに使える…)

106 :nobodyさん:04/02/26 02:40 ID:???
>ジャンルに特化するのは良いと思うけど、特化しにくいジャンルはどうすればいい?
そうゆうのはGoogleにお任せで。

107 :nobodyさん:04/02/26 10:21 ID:???
次はフリーの検索エンジンスクリプトについて語ろうか。

108 :nobodyさん:04/02/26 11:34 ID:???
>>107
スレ違い

109 :nobodyさん:04/02/26 14:55 ID:khyHj+7H
>>108
だって君達検索エンジン作るって言ったって
YomiとかCosmoNaviとかの既存のスクリプト使って作るんだろ?
それとも一から自分で作るのか?

110 :nobodyさん:04/02/26 15:00 ID:QRXddEDf
            __,,,,_
            /´      ̄`ヽ,
            / 〃  _,ァ---‐一ヘヽ
         i  /´       リ}
          |   〉.   -‐   '''ー {!
          |   |   ‐ー  くー |
           ヤヽリ ´゚  ,r "_,,>、 ゚'}
         ヽ_」     ト‐=‐ァ' !
          ゝ i、   ` `二´' 丿
              r|、` '' ー--‐f´
         _/ | \    /|\_
       / ̄/  | /`又´\|  |  ̄\

    俺様がみあか様だーよ キヒヒ
     悔しかったらここまできな
http://school.2ch.net/test/read.cgi/senmon/1074344178/l50

111 :nobodyさん:04/02/26 19:53 ID:???
>>109
一から作るからこのスレで話してるんだろ

112 :nobodyさん:04/02/26 23:27 ID:???
>>111
嘘?マジで?
Yomi-SearchとかCosmoNaviとかAmigoNavigatorなどの
既存の検索エンジンスクリプトを使わないなんてすごいね。

ちなみにもう自作のスクリプトは動いてるのかなみんな?

113 :nobodyさん:04/02/27 03:06 ID:???
>>112
ていうか別に凄くないじゃん。なんでそう思うの?
検索エンジンにもいろいろあるし。何か大きなの想像しすぎてない?

114 :nobodyさん:04/02/27 11:14 ID:???
>>113
Yahooのようなカテゴリ型の検索エンジンの話と仮定すると
あのYahooのカテゴリの階層ってどのように管理すればいいのかとか
カテゴリのショートカットはどうしようかとか結構大変でしょ?

115 :nobodyさん:04/02/28 10:13 ID:???
あら、止まっちゃったよ。

116 :nobodyさん:04/02/28 17:31 ID:+L9rAJmN
自前で検索エンジン作った人は環境を教えれ。

117 :nobodyさん:04/02/28 18:00 ID:???
隊長!こんなの見つけました!
http://yellow.ribbon.to/~mil/

118 :nobodyさん:04/02/28 22:02 ID:???
>>114
dmoz 使う。以上。

119 :nobodyさん:04/02/28 23:15 ID:+L9rAJmN
>>118
やっぱり自前で作る場合、Yahooレベルのものを作るのは無理かな?

120 :nobodyさん:04/02/29 01:44 ID:???
Yahoo! も dmoz もそうだけど、カテゴリのメンテナンスは人力だからね。
精度を気にしないなら GETA とか使ってクラスタリングするといい。

121 :nobodyさん:04/02/29 01:45 ID:???
Yahoo!なんて何人体制でやってんのかな?

122 :nobodyさん:04/02/29 05:52 ID:???
Yahooの、親がソフトバンクだった事を最近しりますた。

123 :nobodyさん:04/02/29 10:38 ID:???
>>122
君はWebプログラム板にいちゃいけない人だ。

124 :nobodyさん:04/02/29 10:56 ID:???
>>123
陳健一だったかな?

125 :nobodyさん:04/03/03 01:18 ID:lXnthRs5
2ch発検索エンジンが出来て欲しい上げ

126 :nobodyさん:04/03/03 13:22 ID:???
http://gamble.x10.jp/
このエンジンは気持ちは分かるが、作りこみが今一かな
更新作業が楽そうで本当は手を焼いてるんじゃないかと思う

127 :nobodyさん:04/03/03 20:52 ID:???
で?ここまで来たら作るぞ喪前ら。

128 :nobodyさん:04/03/03 23:21 ID:lXnthRs5
お前等が作ろうとしてる検索エンジンってのはどうゆうの?
カテゴリ型なのかロボット型なのか。
使用言語は何か。データはテキストで扱うのか、それともDBに格納するのか。

129 :nobodyさん:04/03/04 00:02 ID:???
山拓エンジンをつくりたい

130 :nobodyさん:04/03/04 05:13 ID:naRm3zqc
最大登録件数をどのくらいで見積もるかで検索速度やスクリプトの内容が大きく変わる。
yomi程度なら誰でも簡単に作れるだろうし、自分で作った方が自由度は高い。
一番の問題は登録するデータをどう増やすのか。
検索サイトを作ったは良いが、登録データが増えず放置されるケースが多い事!

131 :nobodyさん:04/03/04 05:50 ID:???
>>128
俺はカテゴリ型でPHP+MySQLで目標10万件を予定してます。
>>130
登録データが増えずに放置されるケースの対策はほぼ出来ている。
もちろん、Yahoo!やGoogleと対抗するのはおかしいが
中規模の検索サイト並みの情報を保てるだろう。

問題は上でも出てきたけど、+αの機能。
ようはユーザーに「迷った時にはここに来よう」と思わせるような検索エンジンであるべきだ。
そう思わせたらお気に入り登録→ホーム登録へとなりやすいだろうし
1年後・2年後には反響も出て商売としても成り立つと思う。

ところで問題の+αの機能。俺が良いと思うのは各検索ごとにRSSのような
ニュース記事が表示される機能。例えば、「パソコン」で検索したら
パソコンに関連したニュースが出るような。すでにどこかが行っている可能性もあるけど。

132 :130:04/03/04 07:58 ID:naRm3zqc
中規模の検索サイトがどこだと言われて思いつかないが分かる方、
教えて下さい。凄く気になる
+αはカテゴリを絞るのが良いんじゃ無いかと思います。
間口を広げると特徴を出すのが難しく、収拾不可能に成るかも知れないです。


133 :nobodyさん:04/03/04 10:03 ID:???
>>132
http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&oe=UTF-8&q=%E6%A4%9C%E7%B4%A2%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%B3
で表示されているサイトかな?個人的にはJOYだな。

んでカテゴリを絞るというのはその通りだと思う。
逆にしぼらなければ無理。

134 :nobodyさん:04/03/05 19:30 ID:N0xwB9R1
JOYが中堅か。確かによく見るサイトだな。
でもどんなところが検索エンジンとして良いんだろう?

135 :130:04/03/05 20:51 ID:SabcyS9O
正直、フリーの検索エンジンスクリプトを使ったのが大量にあるので、
検索サイトも見慣れた感じがあるのと、アクセス支援のためだけの検索エンジンが増えて、
検索サイトへの興味が薄れて来てる。
ユーザが使おうと思うのがほとんど無くて、アクセス支援の登録のためだけに存在する検索エンジンは不必要。

なんかスレッドフロートBBSを設置すれば人が集まると勘違いしてる人と同じな状況でもあるのかな?

JOYは中堅なんですね。古くからあるところは老舗っぽくて存在は知ってても使わないのが寂しいkな。
検索エンジンの大手・中堅とかのセグメント分けをしたリストがあれば面白いけどね。
検索サイトの検索エンジンとかメタサーチとかも今一だし、大手ポータルには敵わないのかな。
そういえば、韓国系のWAKANAって今あるのかな?

136 :130:04/03/05 20:56 ID:???
www.wakanao.co.jp
WAKANOだった。WAKANAじゃないのね。
でもここ重たくて機能してないみたい。

137 :nobodyさん:04/03/05 20:57 ID:???
思うんだけど、アクセス解析を付けている人なら分かると思うけど
gooもinfoseekもフレッシュアイもその他の検索エンジンも
Yahoo!やGoogleには到底及ばない。100:1いや、1000:1かもしれない。

なぜgooやInfoseekが出遅れた(もしくは越された)かと言うと
企業的な思惑はあるにせよ、Googleと比べて圧倒的に検索されるページと
検索時間が劣るからだ。逆に言えば、Googleはそれに特化して
現在の地位を保っていると言っても過言ではないと思う。
Yahoo!は「検索エンジン」というよりはすでにインターネット=Yaoo!になってきているから
全く別問題だと思うが。

それで、これらに対抗しようと思ってもいくら人や金があっても無理。所詮”猿真似”だからね。
では、どうすればいいのか?というとオリジナルの「何か」が必要なわけで。
検索エンジンとはとか違うけどblogなんかはかなり参考になると思う。

138 :nobodyさん:04/03/05 21:04 ID:???
あともう一つ。検索ページが取りざたされているけれど、問題は
やっぱり量より”質”だと思う。
SEOにも当てはまるがユーザーにとっては「知りたいページ」が見られたら
それで言い訳で、知りたいページ・類似したページは多くても10ページあればいいわけで。
という事は検索した際により多くの情報が出るよりはより「ユーザーの考えにあったページ」
が検索結果に現れるといいわけだ。

こうなるともう、ブラウザにATOKのような機能を付けて
検索ワードの保護をしてやらないといけないわけで・・・M$任せになるな。。

139 :nobodyさん:04/03/06 00:45 ID:mLIiHzki
誰か自分の作った検索エンジン晒す香具師いない?

140 :nobodyさん:04/03/06 00:48 ID:???
作ってるヤシ少ないんじゃない?

それなりに長期に渡って運用していかないとデータ量すくないし、

逆に、データが増えたらとてつもなく膨大になるし・・・

141 :nobodyさん:04/03/06 01:20 ID:???
きょうび、そんなもん作るより、
googleのデータを何とか整理すればと思うが・・・。

142 :nobodyさん:04/03/06 03:09 ID:???
ちょっと違うかもしれないけど、Amazonにアカウント登録してると、
最近チェックした商品をもとに、マイページみたいなところでタイプの似た商品なんかを上げてくれるんだけど、
検索エンジンにも、そんな風に以前の検索結果と似たタイプのものを出してくれると、
知りたいページが得られるとか思った。

ついでに、とても中規模に収まらないと思った _| ̄|○

143 :nobodyさん:04/03/06 06:23 ID:???
>>142
おれも同じ事考えている。別にアカウント登録して無くても出来る見たいだし。
概念としては検索エンジンにキャッシュ機能みたいなのをつけて
検索ワードで判別して付随ページを抽出すれば。

中規模で収まる気がする

144 :nobodyさん:04/03/06 07:21 ID:m/dCwq/8
>>143
かなり昔からあった機能ですね。
話は違いますが、前に検索したキーワードを出したり、類似性の高いキーワードを出すサイトもありますね。
yomiサーチを使ってるところが多すぎて、面白みが全く無い気がします。

自前の検索サイトを晒す勇気はありませんが、ブックマークで来てる人の少ない事。
137さんが言っている様にGoogle&Yahooがほとんどでgooがちょぼちょぼのアクセスです。
聞いた話ですが、某アダルト検索サイトの運営者がログを見たら、
上位キーワードが自身のコンテンツの名称だったそうです。
ブックマークをするのも面倒なのか、それとも家族でPCを共有してるのか、興味深い話でした。
サイト名称は分かり易くし、独特な名前にするのが良さそうです。

145 :nobodyさん:04/03/06 09:46 ID:???
>>144
だろうね。極端な話アダルトなら「AV Search」でもいいと思う。
3,4年前はこういう名称のつけ方は「ありきたりでダサい」と言われてきたけど
逆に今はわかりやすくていいと思うし。

ところで

>話は違いますが、前に検索したキーワードを出したり、類似性の高いキーワードを出すサイトもありますね。

って書いているけど、具体的にはどこ?俺は知らないけど・・。

146 :nobodyさん:04/03/06 09:53 ID:???
あ、もう一つ思いついたのでこのスレに書き留めとくw

Yahoo!&GoogleとgooやinfoseekやMSNなどを含めて決定的に違うこと。
それは「検索エンジンだと理解されやすいデザイン」だと思う。

例えばネットに詳しくない人はフォームがあったからってそれがなんなのか?
検索って何?みたいな人が多いわけで。
それでも使っていくうちに分かるわけだが、MSNなんか特にそうだけど
どの部分が検索フォームかわかりにくい。と言うより「検索以外に目が行く」
と言った方がいいかもしれないね。それだけ検索エンジンには力をいれてないのだろう。

しかし、Googleはもちろん、旧Yahoo!なんかも明らかに検索フォームが”目立つ”
だから利用しやすいしわかりやすいと思うんだよね。

ちょっとプログラムとは違うけど、デザイン的な作り方もかなり重要だと思った。


147 :145:04/03/06 10:16 ID:m/dCwq/8
類似性ってのは言い方が悪かったかも知れませんが、
合わせて検索される頻度が高いキーワードのチャックボックスやリンクが出る奴ですね。
旧Infoseekはそうでしたし、今はつながりシークだったかな名称が・・・
米国では結構あった気がしますが、思い出せない。

アフィリエイト全盛で広告に埋没した検索サイトも多くデザインは度外視かも知れないですね。
検索サイトは圧倒的なヒット数が無いと利益を出すのは難しいですね。

148 :nobodyさん:04/03/06 13:42 ID:???
こんなのがあったらいいな…。
『共通語リスト』

例えば「プログラム 言語」で検索すると
「C / Java / VB ...」みたいに検索結果の中で良く出てくるキーワードを
抽出する。それをクリックすることで検索結果から「Java」を取り除いたり
「C」でフィルタリングしたり…。

結局はAND検索になるのだけど、良く出てくるキーワードがリストで出てくると
「なぜ、検索結果がぼやけるのか」が分かるような気がする。

検索者は「プログラム言語といえばCだろ!」と思って、「プログラム 言語」で
C言語の情報を探そうとしているが、予想以上にJava関連の情報が多かったりする
ことが一目で分かるよね。

/* この例ではキーワードが下手すぎるがそれは置いておく */

149 :nobodyさん:04/03/06 13:52 ID:???
>>148
そそ。そういうのいいよね。

自サイトにアクセス解析を置いている人なら分かると思うけど
たまに「どうしてそのキーワードなの?」って人が訪れてくるからね。
キーワードの選択の仕方がわからないっていう場合が多い。

日本語って難しいからな〜

150 :nobodyさん:04/03/06 19:49 ID:???
>>148
Excite が一時期やってたけど、すぐやめたね。

151 :nobodyさん:04/03/07 01:24 ID:???
参考になるかわからんけど、gooラボに質問形式で検索する検索エンジンがある。
ttp://labs.nttrd.com/


152 :nobodyさん:04/03/07 15:19 ID:???
>>151
一瞬いいと思ったんだが、”回答を登録できる”ってのが
いたずらをされる可能性も高く、使えないね。

ただ、グラフにして表示するのはいいと思う。
検索エンジン内のデータ件数・キーワード数+特定ワードを調べて。

153 :nobodyさん:04/03/07 23:47 ID:???
つーか2chこそが最高の検索エンジンだとは思わないかね?

154 :nobodyさん:04/03/08 02:16 ID:???
>>153
思わん

155 :nobodyさん:04/03/08 07:19 ID:???
2chの99%はゴミ。

156 :nobodyさん:04/03/08 14:12 ID:???
>>153
2ch内をまともに検索できれば最強…
ってひろゆきが既にやってた。http://find.2ch.net/

157 :nobodyさん:04/03/08 22:19 ID:???
>>156
Googleで「site:2ch.net キーワード」で検索した方がいいかもね。


158 :nobodyさん:04/03/09 16:17 ID:???
>>156, 157
どっちにしても良いとは思わないが…


159 :nobodyさん:04/03/09 17:38 ID:???
いや、俺は2chがそんな事をしていたのか!っとびっくりした。
機能、どうこう言う前に。

160 :nobodyさん:04/03/09 17:39 ID:???
と思ったら、検索するのに金取るじゃん・・・。

161 :nobodyさん:04/03/10 19:37 ID:XZBETSH0
>>160
金取るのかよ・・・

162 :nobodyさん:04/03/10 20:59 ID:???
>>149
キーワードの選択って考えると、ディレクトリ登録型のほうが便利だよね。
自分から絞り込んで行けるから。

>>161
本文と投稿者を検索するとき金がかかるみたい。
スレタイ検索は無料っぽい、というか普通にできたよ。

163 :nobodyさん:04/03/10 21:23 ID:???
思い出したので追記。

>>146
米Yahoo!がGoogleみたいな検索のみのページ始めたよ。
http://search.yahoo.com/

infoseekとかgooって、Googleと違ってポータルサイトってやつだから別モノなんじゃない?
WEB全体を検索するのはまず自分のとこにある記事を見てからっていうか、
自分のところで一般的な(?)情報は手に入るようにしてあるような。

164 :nobodyさん:04/03/11 20:35 ID:uu5Wjkv7
つーかYahooみたいに技術者いっぱい抱えてるようなところが
何故今まで自社でロボット検索エンジンを開発しなかったのか。

165 :nobodyさん:04/03/12 02:14 ID:???
>>165
してたよ。

166 :nobodyさん:04/03/13 13:49 ID:???
何故自分にレスする?

167 :nobodyさん:04/03/16 19:54 ID:OF6zD5aF
こんな検索エンジンがありました。
ttp://www.tkensaku.com/
類似性検索の逆?が実装されています。
まだ荒いけど、これから面白くなるかもしれませんね。


168 :nobodyさん:04/03/16 20:51 ID:???
>>167
12億ページのインデックスでこの速度は凄い
精度、鮮度は分からんが

アルゴリズムを発表してほしい

169 :nobodyさん:04/03/16 20:53 ID:???
訂正
15億超えてました

20億超えている?

170 :167:04/03/16 21:14 ID:OF6zD5aF
>> 168
12億ページもインデックスされていないのでは?
google で「図書館」が約300万
tkensaku で同じキーワードで約19万
単純にいって15分の1ぐらいでしょ。
google全体でも42億ですし、
tkensaku は日本語だけだからもっと少ないはず。
    

171 :nobodyさん:04/03/16 23:20 ID:???
>>170
ごめん、間違えた。
150万ページはインデックス化されている。

「本」に関連する1508985ページ中の第1位から第10位までを表示しています。
ttp://210.189.72.196/sclient.cgi?value=%96%7B

4年超で法人登記して150万ページか

Record last updated on 02-15-2000 05:51:52 GMT
Record expires on 02-15-2011 05:51:52 GMT
Record created on 02-15-2000 05:51:52 GMT
Database last updated 03-16-2004 21:37:12 GMT


172 :nobodyさん:04/03/20 22:57 ID:hMly4azr
人工無能と組み合わせて、おしゃべりしているといろんな
url を紹介してくれるようなプログラムを作ってみようと
思っているのですが、どこかに先例のようなものはありませんか?
まだ誰も思いついていない?


173 :nobodyさん:04/03/21 03:35 ID:???
>>160
金取るが、書いた30秒くらいに反映されたり、
2ch内のすべての文章から検索してくれたり、と
その気になれば結構使える検索エンジンかも。
お金を払うのはちょっとつらいが。

性能はかなりよさそう。

174 :nobodyさん:04/03/21 03:37 ID:???
>>173
当分はCtrl+Fで十分だろう。

175 :nobodyさん:04/03/21 21:30 ID:???
Googleってどうやって稼いでんの?

176 :nobodyさん:04/03/21 21:58 ID:???
>>172
まゆらにしゃべらせてーとか思ったものさ。

177 :nobodyさん:04/03/22 16:47 ID:???
>>172
MS-Officeでイルカの消し方がFAQになることと、Googleが好ましいとされる理由に「余分なインターフェースがない」が上位に挙げられることを思うと、あまり成功しない気がするよ。
検索エンジンとつながるマスコットが昔あったような気がするな。打ち込んだキーワードを学習して、時々新しいURLを勝手に拾ってきては、飼い主に「みてみて」とせがんでくる奴。

178 :172:04/03/23 00:02 ID:???
>>177
確かにうざったいと誰も使ってくれないでしょうね。
検索をしたいときに遊びっぽいとうざったいけど、
遊びたいときにたまたまurlを発見してくれるとか。
やっぱりだめかな。



179 :nobodyさん:04/03/23 00:47 ID:???
オールアバウトのリンク集を拾ってきて検索させれば精度のいい検索サイトになるかも。
要はそのサイトを誰かが評価してあればいいんだよ。

昔はNTTの新着情報からのアクセスが一番多かったものだけど、
ググルに新着情報ページがあれば結構アクセスあるかもね。

180 :nobodyさん:04/03/31 22:06 ID:???
会話をキーボードでタイプするくらいなら、キーワードだけタイプしたほうがいいけど、
音声で会話できるなら、会話型インタフェースも悪くないと思うよ。


181 :nobodyさん:04/04/04 01:28 ID:???
>>1は完成できたの?

182 :nobodyさん:04/06/05 23:35 ID:KbDZzecN
a

183 :nobodyさん:04/06/10 01:45 ID:???
ところで、データはどやって集めるの?
いずれはユーザに登録させるとしても、最初は
人力で集めるんでしょ?

リンクの多そうなサイトを登録して、そこから
リンクたどってって、徐々に増やしていくとか?

自分も特定の分野の検索サイトをやりたいんだけど、
エンジン作りに挑戦してみようかな。

どっかに、検索エンジンの基本部分を解説してる
サイトってない?

184 :nobodyさん:04/06/10 20:45 ID:???
Yomi-Searchでも弄っとけ

185 :nobodyさん:04/06/19 21:21 ID:???
ロボット検索エンジンはどうやって
作ればいいのかわかる奴いますか?

「クローラの自動巡回でデータ集める」
ってどうやるんだよ・・・分かんねぇ。

186 :nobodyさん:04/06/21 01:07 ID:???
>>185
まずは、クローラ買ってこいや

187 :nobodyさん:04/06/21 14:32 ID:???
>>185
間違ってクロレラを買ってくるなよ

188 :nobodyさん:04/06/23 21:06 ID:???
>>185
Yahooあたりからリンクを辿っていくとかどうよ

189 :nobodyさん:04/07/02 03:03 ID:wbSwwq8f
他スレで質問しましたが、スレ違いだったようなのでこちらで質問させて下さい。

【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【.  目 的  】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【.  条 件  】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名  称  】 まったく見つからず
■これだけはやりました
>>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【  調べたサイトの名前  】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは?  ..】 ロボット型検索技術 クロール ソフト

恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。

ちなみに下記2サイトで私がやりたいような事を行っております。

http://www.bestgate.net/

http://yasune.dokoda.jp/

このような技術の雛形などご存知の方いましたらどうかご教授下さい。

190 :nobodyさん:04/07/02 03:08 ID:???
>>189
http://pc5.2ch.net/test/read.cgi/php/1086715675/235
↑バラ撒きっぱなしか?

# どこのテンプレを使い回しとるんだ…。

191 :nobodyさん:04/07/02 03:52 ID:???
でもクローラってどうやるのかまじで知りたい


192 :nobodyさん:04/07/07 01:24 ID:???
何かに特化したサーチエンジン、というかデータベースなら需要がある
だろうが、でなければ意味ないわ。
価格比較にしても、まずは価格比較サイトにいくだろ。ロボットで価格を
漁るということに何の意味も見いだせない。

クローラーは単純だ。「波乗り野郎」みたいなもんだ。
ttp://www.bug.co.jp/nami-nori/


193 :nobodyさん:04/07/23 16:09 ID:ackJdXhi
これも特化した検索サイトだな
http://www.surpara.com/

194 :nobodyさん:04/09/03 04:40 ID:bPh7a+Nk
yomiスレ死んだ?

195 :名無しさん:04/10/08 01:02:54 ID:TPGoBuLX
サーチエンジン
http://umasql.netkeiba.com/db/horse.php?hid=2000101537

196 :nobodyさん:04/10/10 23:39:08 ID:FanGpL5a
ディレクトリ型検索エンジンなんてDB使えば結構簡単に作れるんジャン?
Googleみたいなロボット巡回型は相当難しそうだけど


197 :nobodyさん:04/10/10 23:40:21 ID:FanGpL5a
3年前の話か、、、

198 :nobodyさん:04/10/13 16:43:48 ID:???
100−200ぐらいのサイトのキャッシュをためてそこから検索する
グーグルの規模を小さくしたような検索エンジン・・・ないよな

199 :nobodyさん:04/10/13 21:56:37 ID:???
ttp://www.dtm.ac/
ここオリジナルのロボットで運営してるよ

200 :nobodyさん:04/12/15 19:54:07 ID:???
age

201 :nobodyさん:04/12/20 08:16:35 ID:???
ロボット型検索エンジン作りたい奴、
頼むから爆撃アクセスするようなロボットは作らないでくれな。
robot.txtやMETAタグには従うように。

どうせIPで弾くだろうけどな。

202 :nobodyさん:04/12/20 10:55:13 ID:SmxJcj5b
うわーすごいのびてる。
さっき書き込んだときは60くらいだったのに。
さすが2チャンネルだなぁ。

203 :nobodyさん:04/12/23 23:53:23 ID:yKblct4O
検索エンジンをつくりには、
1.Inverted File Structureを勉強すること。
2.形態素解析
3.ロボットのこと テキストだけ抜き鳥。


204 :nobodyさん:04/12/24 00:28:16 ID:nkV22Kja
http://ex7.2ch.net/test/read.cgi/news4vip/1103802443/l50

205 :nobodyさん:05/03/13 19:43:57 ID:cxiEkR1N
第2回検索エンジンアンケート実施中!

http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84

206 :nobodyさん:05/03/14 19:36:30 ID:???
鯰じゃだめなのか?

60 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)