2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

検索エンジンの作り方

1 :Fry:05/02/02 20:57:21
こんにちは、初書き込みです。
これからお世話になりますがどうぞよろしくお願いします。
私PCの知識がなくてよくわからないのですが。
検索エンジンと言う物を作ってみたいんですけど、
作るにはどうすればいいのでしょうか?



2 :デフォルトの名無しさん:05/02/02 20:57:59
クソすれ2ゲット

3 :デフォルトの名無しさん:05/02/02 20:59:43
1) まず パソコンショップに言って できるだけ性能のよいパソコンを買います。

4 :Fry:05/02/02 21:03:02
はい

5 :デフォルトの名無しさん:05/02/02 21:04:10
2ストか4ストか選ぶ

6 :Fry:05/02/02 21:15:48
はい

7 :Fry:05/02/02 21:17:25
>>5
バイクのエンジンじゃないですか?

8 :デフォルトの名無しさん:05/02/02 21:18:14
検索エンジンか
まずはモーターと電池を買ってこい

9 :Fry:05/02/02 21:31:24
ましな人はいませんか?

10 :デフォルトの名無しさん:05/02/02 21:37:21
まずサーバを500台用意しなさい。話はそれからだ

11 :デフォルトの名無しさん:05/02/02 22:14:53
その500台のサーバにLinuxとMySQLをインスコだ。

12 :デフォルトの名無しさん:05/02/02 22:30:43
ハードウエアの問題はお金で解決できそうです。
個人で使用するのでサーバーは10台買います。
ハードディスクは2000Gバイトを用意します。

次の3つのソフトウェアについて情報を下さい。

1 データを自動的にかき集めるソフトウェア
2 書きかつめたデータに高速検索用のインデクスをふるソフトウェア
3 高速検索用のソフトウェア

MySQLの全文検索は遅いので、2000Gのテキストを20秒以内に検索する
ソフトウェアを探しています。よろしくお願いします。

13 :デフォルトの名無しさん:05/02/02 22:33:53
探していますって…
作るんじゃなかったの?

14 :デフォルトの名無しさん:05/02/02 22:36:10
システムを作るんだろ。プログラム板だけどねw

15 :Fry:05/02/02 22:40:52
>>12ありがとうございます。
>>14
よく見ると板違いでしたw

16 :デフォルトの名無しさん:05/02/02 22:44:22
こ、こいつうぜぇ

17 :12:05/02/02 22:49:09
>>14
>システムを作るんだろ。プログラム板だけどねw
全てをゼロから作るのは無理。利用できる便利なツールは
出来るだけ利用して、利用できない部分を自分でプログラム
を書く。次の3つは便利なツールがありそう。

1 データを自動的にかき集めるソフトウェア
2 書きかつめたデータに高速検索用のインデクスをふるソフトウェア
3 高速検索用のソフトウェア

18 :Fry:05/02/02 22:53:37
>>17
ありがとう

19 :デフォルトの名無しさん:05/02/02 22:54:59
google使えば簡単。

20 :デフォルトの名無しさん:05/02/02 22:55:22
逆切れかw
> 利用できない部分を自分でプログラムを書く。
この部分だけ話題にするのがこの板だろうに

21 :12:05/02/02 23:15:42
>>20
公開されているツール/ライブラリの機能を確認した上で、
利用できない部分を自作する。Cコンパイラーをゼロから
書く馬鹿はいない。

○屋上屋おくを架す(広辞苑)
無用のことをするたとえ。「屋下おくかに屋を架す」とも。

22 :12:05/02/02 23:17:03
>>19
>google使えば簡単。
使用制限があるから自由には使えない。だから自作する。
でも利用できるツールは利用する。

23 :デフォルトの名無しさん:05/02/02 23:25:43
そんな使いかたしなけりゃいいじゃん。

24 :デフォルトの名無しさん:05/02/02 23:38:56
そもそも要求定義が定まっていない。

25 :デフォルトの名無しさん:05/02/02 23:48:06
>>12
まず何を作りたいのかぐらい言えよ。

26 :12:05/02/02 23:53:49
>>25
>>1
>検索エンジンと言う物を作ってみたいんですけど、
多少、遅くてもよいので、インターネット上で公開されている
全ての文字データをかき集めて、形態素処理をして、多少、
複雑な検索(この部分を自分でプログラミングする)を行う。
検索結果の出力形式はGoogleのようにKWIC形式が見やすいので、
これを目指す。

形態素処理のソフトウェアは分かったので、かき集めるソフト
ウェアと高速検索のためのソフトウェア(MySQL以外のもの)に
関する情報を下さい!

27 :デフォルトの名無しさん:05/02/02 23:58:50
形態素処理のソフトウェアは何を使うの?

28 :12:05/02/03 00:10:44
>>27
「形態素処理のソフトウェア」でGoogle!


29 :デフォルトの名無しさん:05/02/03 00:17:49
>>28
0件だったし形態素処理に何使うかによっても
状況は変わってくるだろうから、教えられる人も教えられないと思うよ。
まあどうでもいいけど。

30 :デフォルトの名無しさん:05/02/03 00:55:26
> ハードウエアの問題はお金で解決できそうです。

ソフトウェアの問題も金で解決してください。

終了。

31 :デフォルトの名無しさん:05/02/03 03:03:58
strstr

32 :12:05/02/03 09:16:28
>>29
>形態素処理に何使うかによっても
英語、ドイツ語、日本語など多くの言語処理ができる
XLEがいいようです。

http://www2.parc.com/istl/groups/nltt/xle/

33 :デフォルトの名無しさん:05/02/03 11:44:45
日本語の場合は茶筅の方がいいんじゃないの。

34 :sage:05/02/03 12:07:58
茶筅+ナマズは、既にやり尽くされているから、できれば少し新しいこと
に挑戦したい。XLEであれば、1つの言語のモジュールを開発すれば、
それを別言語でも利用できるはずなので、拡張性がある。

1 かき集めるツール(他人が作ったのを利用)
2 XLE(他人が作ったのを利用)
3 XLEの出力結果を整形するツールを自作する
4 整形したデータをデータベースに読み込ませる
5 高速検索をするツール(他人が作ったのを利用)
5 KWIC出力をする(一部自作のプログラム)


35 :デフォルトの名無しさん:05/02/03 14:00:41
>>34
> 1 かき集めるツール(他人が作ったのを利用)
自分で作らないと。 JPNIC

36 :デフォルトの名無しさん:05/02/04 10:56:50
LFGでやるのか。頑張ってね。

37 :12:05/02/04 21:45:13
>>36
>LFGでやるのか。頑張ってね。
去年の日本の言語処理学会で日本語XLEが賞を取っていたし、
ヨーロッパではLFGが大人気。

7 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)