[リストへもどる]

一括表示

▼ サーチャー - としき@家主 2023/12/28 12:51 No.4049
  ┗Re: サーチャー - めざら 2023/12/28 17:19 No.4050
   ┗Re^2: サーチャー - としき@家主 2023/12/30 00:12 No.4051
    ┗Re^3: サーチャー - としき@家主 2026/05/04 13:42 No.4448
タイトルサーチャー
記事No4049
投稿日: 2023/12/28(Thu) 12:51
投稿者としき@家主
参照先http://toshiki.la.coocan.jp/
いろいろと記憶が怪しくなりつつあるので、今のうちに書いておきます。
要は、個人的な雑記というか備忘録。

サーチャーという職業があることを知ったのは、大学生のころだったか、社会人
になってすぐぐらいだったか。ただ、最初は、データベースを検索する仕事だ、
ということくらいしかわかりませんでした。
データベースというものの存在は、高校生のころから知ってはいました。
8ビットパソコンのBASICの時代ですが、企業が顧客管理データベースを構築する
というような話をパソコン雑誌で読んだりしていたのです。また、カード型とか
リレーショナル型といったデータベースソフトも、初期の16ビットパソコンでも
発売されていました。でも、パブリックなデータベースとして当時の書籍などで
紹介されているものは、国内では、特許のデータベースと、国会図書館あたりの
蔵書のデータベースぐらいしかなかったと思います。
その当時、情報を探す仕事といえば、レファレンス業務を担当している図書館の
司書が筆頭。実際、サーチャーを紹介している記事を最初に読んだ際にも、この
仕事には司書の資格を持っていると役に立つ、というような感じで書かれていた
記憶があります。
で、まぁ、当時の知識では、データベースというものに対する理解が少なかった
せいもあって、面白そうだけど難しそう、というものでした。何せ、検索を行う
際のインターフェースも知らなかったわけだし。だからこそ、そういう特殊技能
を持った職業が成り立つのだと思ったわけです。

社会人になってパソコンを買い、ニフティに加入して知ったのが、ニフティ経由
で新聞記事のデータベースにアクセスできる、ということ。へぇ、そういうのが
あるんだ。ただ、当時は、自分には縁遠い世界だと思っていました。
が、社会人3年目ぐらいのとき。
会社の研修で、いろいろなデータを集めてレポートを作る羽目になりました。
そこで初めて、ニフティ経由で新聞記事データベースにアクセスしてみました。
なるほど、こういうものなのか。
当時を覚えている方もいるかもしれませんが、今から考えるとインターフェース
は貧弱ですし、新聞社によっては全文検索できずタグ付けされている用語でしか
検索できなかったりと、面倒なことは多かったですね。
また、新聞記事以外にも各種のデータベースにニフティ経由でアクセスできると
知りました。が、そもそも検索に対するニーズが自分の中で顕在化していません
でした。
ここまでが90年代中ごろまでの話。

こうして、だんだん自分の中での検索のニーズが確立してきました。
つまり、欲しかったのは全文検索。とはいえ、全文検索できるほどの元データに、
このころはそもそもアクセスできませんでした。
そして、それなりに量のある全文データとしてアクセスできるようになった最初
のものが、ニフティの過去ログ。これは手元にあるテキストです。
テキストの検索といえばgrep。grepそのものは以前から知ってはいたというか、
下手したらDOS付属のfindよりも使っていたかもしれませんが、これが真価を発揮
するような使い方ができたのって、ニフティの過去ログが初めてでしょう。

90年代後半、インターネットブームが来ると当然、ネットでいろいろなものを
探したくなります。が、最初のころは検索サイトはディレクトリ型だけ。これは
カテゴリで分けられているもので、文字列で検索しても、サイトのタイトルとか
簡単な紹介文とか、サイトの側でつけたタグのようなものを検索するだけ。でも、
探せるだけましではありましたけどね。
その後、全文検索をはじめる事業者が出てきました。国内ではディレクトリ型の
大手だったyahooも始めたし、あとはgooなんかもありました。海外の事業者でも
日本のサイトを検索できましたが、やはり日本のWEB検索では国内の事業者の
ほうが精度よく見つかりました。
そんな中、登場したのがgoogle。
今調べたら、検索サービス開始は97年、会社設立は98年とありますね。
98年当時はもう、高精度検索として有名になっていました。
私が知ったのも98年ごろ。アメリカで大人気、ということで知りました。
だけど、この当時はまだ日本語のサービスも始まっていなかったし、アメリカの
会社だからどうせ日本語のサイトなんかあんまり見つからんだろうと思っていた
のですが、試しにアクセスしてみたところ、日本のサイトが日本語でざくざくと
見つかる。もうね、一発で乗り換えました。

結局、職業としてのサーチャーになるのは無理だけど、私、検索大好きなんだな。
あれだ、本を読むのが好きな人が手当たり次第に読むのと同じような感じかも。
これからも、いろいろと検索しまくることでしょう。
 

タイトルRe: サーチャー
記事No4050
投稿日: 2023/12/28(Thu) 17:19
投稿者めざら
参照先http://mezala.la.coocan.jp/
レス元4049
わたしも,いち司書として,すでに怪しくなった記憶を記しておきます。(不正確かもしれません)

わたしが司書になりたての頃,既にサーチャーという職業はあったようです。
ただし,現在のようなオンラインデータベースを単純に検索するものとはかなり異なりますね。

データベースというものは主に医学や生化学の分野で最初に発達したものだと思われますが,
80年代はじめはまだ紙の索引誌が主役でした。Index Medicus や Chemical Abstracts といった
とんでもなく分厚い(下手すると8センチくらいの厚み)の索引誌です。サーチャーは,
(もちろん米国では既にオンラインが主流かもしれなかったけれど)それらの索引誌のページを繰って
研究者の求める文献に接近するために手がかりとなるキーワードを組み立てるのが仕事でした。

わたし自身は,ほんの1年かそこらドクメンテーション研究などの専門誌を読んで勉強を始めたら,
JOIS(JICST:現JSTのデータベースサービス)が公衆回線での利用が始まってしまったので,
それらの紙索引の醍醐味をしっかり味わうこともありませんでした。

しかし,当時の通信速度と言ったら,300BPS の音響カプラを黒電話の受話器にかぶせての通信ですから,
いくら事前にキーワードのかけ合わせなどを組み立てていても秒単位で課金されていくプレッシャーに
とても耐えきれずに手が震えてタイプミスを繰り返してばかりいました。たとえて言うなら,
スロットマシンのような速度で回るタクシーの料金メータを前にしているようなものです。

それで考えれば,現在の研究環境って恵まれているなぁ……としみじみ思います。
そこに生成AIでしょ? もう笑いが止まりませんよね。(何)

司書資格を持っていると有利なんて時代は終わりました。
この業界は,もうほとんどが非正規雇用になってしまいました。
レファレンスサービスを高評価してくれる利用者なども滅多に見られません。

タイトルRe^2: サーチャー
記事No4051
投稿日: 2023/12/30(Sat) 00:12
投稿者としき@家主
参照先http://toshiki.la.coocan.jp/
レス元4050
いろいろと思い出してきました。

私が大学生のころなんで80年代後半のこと。
データベースとかサーチャーとかについて書かれた本を読んだんですよ。
なお、読んだのはその時期ですが、その本が書かれたのが必ずしもその時期とは
限らない。
前にも書いたように、データベースそのものの存在については高校生のころから
知っていましたが、サーチャーというものがあるということを知ったのはその本
を読んだときだったような気がする。
なので、就職のとき、サーチャーという仕事を目指そうかと一瞬考えたのですが、
市場規模が小さい、すなわち求人が少ないと考えて、その方面を目指さないこと
にしたというか、普通に就職することにしたような記憶があります。
ちなみにその本、図書館で借りたもののはず。
ただ、地元の図書館だったか、学校の図書館だったか。
強烈に覚えているのは、縦書きの本だった、ということ。
あと、うろ覚えレベルでは、中公新書とかによくあるような、薄めの新書版の本
だったような気がする。一冊丸々読んだ記憶はあるのですが、タイトルも作者も
本の主題も覚えていない。ただ、最後のほうの1章か2章を使ってデータベース
にアクセスする実例みたいなものを載せていたはず。そのときのサンプルとして
米国の国会図書館へのアクセス例を載せていたのではなかったかなぁ。
これだけの手がかりで、わかる人ならそれがなんという本だったか調べられると
思うけど、さすがに私の検索能力ではわからない。(笑)

> そこに生成AIでしょ? もう笑いが止まりませんよね。(何)

そもそも人間なんて、何千年も昔から、自分のやるべきことをどのように他者に
やらせるか、ということを常に考えている生物ですからねぇ。かつては奴隷とか
いう名称でしたが、ある種の本能なんでしょう。機械ならこき使ってもいいのか、
というのは作家とか漫画家がくどいほど取り上げている主題ですし。
そういえば、しばらく前に話題になった笑い話、えと、どこのサイトがいいかな。
ここにしよう。

nlab.itmedia.co.jp/nl/articles/2304/18/news027.html

こういう話を聞くと、精度の関係から、まだあと数年は人間が勝てる、と思う。
ただ、5年後10年後にどうなっているやら。

> レファレンスサービスを高評価してくれる利用者なども滅多に見られません。

絵描きさんとか、本当に生成AIで大変そうですけど。
でも、そんなものができる前から、ただ同然でクリエーターを働かせようとする
クライアントが多い、というぼやきがそちらの方面からは聞こえていたわけで。
小説も、そのものの作成は生成AIにはまだ無理のようですが、あらすじ程度なら
今でもそれなりに使い物になるようですし。
クリエーターがそうなんですから、それ以外の職種は推して知るべし。
 

タイトルRe^3: サーチャー
記事No4448
投稿日: 2026/05/04(Mon) 13:42
投稿者としき@家主
参照先http://toshiki.la.coocan.jp/
レス元4051
まずは補遺。

> nlab.itmedia.co.jp/nl/articles/2304/18/news027.html

久しぶりにアクセスしたら、ねとらぼはURLの構成が変わっていて。
現在は

nlab.itmedia.co.jp/cont/articles/3354837/

となっています。
で、まぁ、このネタと関連して。
私、ここ数年、かつて読んだ小説を探しているのですが、全く見つからない。
どこで読んだか、というのは割と覚えている。
隣町の本屋での立ち読み。だから、最初の1章の途中まではしっかり。
途中はぱらぱら、最後の結末の1章はしっかり。
全部しっかり読むなら買いますよ。
で、その本屋で立ち読みをするようになったのは80年代。
そしてその本屋、80年代末には移転したので、読んだのは80年代確定。
文庫か新書だったのですが、どちらだったかはさすがに覚えていない。
で、だいたいのあらすじも覚えているので、Google Gemini とか MS Copilot に
ぶち込んでみたのですがね。手を変え品を変え何回も。しかし、Copilot は概ね
降参。 一方で Gemini。こいつがいいかげんな回答を返してくる。
あるときは、半村良とかその系統のSF小説。
またある時は森詠の陰謀小説。
でも、深掘りすると、どうやらそんなタイトルの小説はなさそう、といったもの
ばかり。
森詠の時はひどかった。ISBN番号まで返してくるのですが、該当の番号は別人の
作品なので、それはどういうことか追及したら、当時、この出版社、絶版にする
と同じコードを別の本に割り当てていたので、他にも同様の事例は多数あります、
とのたもうた。でも、国会図書館の検索なら、このコードで両方が表示されます、
とのこと。ただ、国会図書館の検索ってよくわからず、裏は取っていない。
あ、でも、他にも同様の事例があるというのなら、その事例を尋ねるべきだった。
もし次があればそうしよう。


ただ、検索ということでさまよっていたら見つけたページ。

www.gizmodo.jp/2025/08/history_of_search.html

これを読むと、AI検索がどれだけ世の中にとって重要かがよくわかる。
#4049にもかいたけど、かつては私も grep を信仰していました。
だけど、grep って、一文字違いでも検索できなくなるわけですよ。
それではAI検索に太刀打ちできない。
あいまい検索を使えば少しは改善するとはいえ、字面の全く異なる同義語の検索
という面では、やはりテキスト検索は不向き。AI検索の独擅場。
なので、これからの時代、grep などのテキスト検索にしがみ付いているような人
は時代遅れ認定されそう。
とはいえ、ネットに上がっていない、ローカルな情報をどうするか、という問題
もあって。勝手にネットにアップすると、情報セキュリティとか著作権なんかの
問題が発生しそうだし。
となると、解の一つは、ローカルなマシンにAIを構築する、というもの。
幸い、現在ではオープンソースの生成AIというものもある。
だけど、今の所はそういうのを動かすためには数十万円クラスのパソコンが必要
らしい。最上級のスマホなら動くものもあるかな。

真にテキスト主義者を名乗る人なら、そういうものにも手を出すべきでしょう。
幸い、私はそうではないけど。
とはいいつつ、私も若ければ「根性で grep」なんてことをしたかも。
でも、そろそろ老い先も短く。
そもそもの根性もないのですが、無駄に grep しまくって根性とか精神力が欠乏
する可能性も高く。その結果、あれができないこれができないなどと愚痴る未来
が見えてくる。

結論。
若くない人(老い先の短い人)ほど、最先端のものに手を出すべし。
#いや、手を出すにも根性が・・・