قابلیت اطمینان
هنگام انتخاب شرکت میزبان، باید به سرعت، سخت افزار، نرم افزار و تنوع ارتباطات اینترنت آن شرکت توجه داشت. قابلیت اطمینان یک سرور، یعنی زمان بالا بودن سرور و بالطبع سایت شما بیشتر از زمان پایین بودن آن باشد.
سؤال مهم:ترکیب سخت افزاری سرورهای شما چیست؟
زمان بالا بودن سرور
داشتن تنوع ارتباطهای اینترنتی در شرکتهای میزبان(محل استقرار سرورها) نکته مهمی است که باید حتما مد نظر داشت. هر چه تعداد ارتباطهای اینترنی بیشتر باشد، اندازه و سرعت سرورها بیشتر بوده و در نتیجه با قطع شدن احتمالی یک ارتباط اینترنتی، سرور و سایت شما همچنان ارتباط خود با اینترنت را برقرار می بیند و بالا خواهد بود. (این پارامتر برای شرکتهای ایرانی که اکثر قریب به اتفاق آنها سرورهایشا ن در خارج از ایران است برای محل استقرار سرورها مصداق دارد.) شرکتهایی در کشورهای پیشرفته آمریکایی و اروپایی وجود دارند که بصورت تخصصی فعالیتشان تامین اماکنی است که ویژگیهای لازم برای استقرار سرورهای میزبان را داشته باشد که اصطلاحا مراکز داده (2) نامید می شوند.
سؤال مهم: سرور شما در کدام مرکز داده قرار دارد؟
پهنای باند سرور
پهنای باند سرور یکی از پارامترهایی است که در میزان قابل دسترس بودن سایت شما تاثیر بسزایی دارد. بسیاری از شرکتها برای اینکه از پهنای باندی که در اختیار دارند بتوانند بدرستی استفاده کنند،مشتریهای خود را محدود به استفاده از پهنای باند معینی در ماه می کنند. برخی شرکتها نیز ادعا می کنند که پهنای باند نامحدودی دارند که این قضیه تا حد زیادی غیر واقعی است زیرا هیچ شرکتی نمی تواند پهنای باند نامحدودی بصورت رایگان در اختیار شما قرار دهد، ولی ذکر این نکته ضروری است که برخی از شرکتها از پهنای باند قابل توسعه(3) استفاده می کنند که این سرویس حداقل این مزیت را دارد که فعالیت سرور هیچگاه متوقف نمی شود و در ازای پرداخت مبلغ بیشتر پهنای باند بیشتر در اختیار شرکت میزبان قرار می گیرد.
سؤال مهم:از چه میزان پهنای باندی در ماه می توانم استفاده کنم؟
حفاظت در برابر قطعی برق
حفاظت در برابر قطعی برق نیز پارامتر مهمی است که باید حتما آنرا در نظر داشت، هر چند که در خارج از ایران و خصوصا در مراکز داده در کشورهای آمریکایی و اروپایی امکان قطعی برق کمتر از 5% است ولی وجود باتری یا ژنراتور برای در دسترس بودن دائم سایت شما حائز اهمیت می باشد.
سؤال مهم:آیا سرورهای شما به UPS مجهز هستند؟
(1) Web Hosting companies
(2)
(3) Burst mode band width
منبع: مجله علم و الکترونیک کامپیوتر
مترجم: وهاب حاجی باقری
مشکل: قبل از اینکه نرمافزاری را دانلود کنید و یا اطلاعات خودتان را به سایت وبی بدهید میخواهید بدانید که این سایت قابل اعتماد هست یا نه. ممکن است شک کنید که احتمالا قربانی phisherها شدهاید.
باید توجه داشت که شناسایی صاحب یک سایت وب بسیار سخت بوده و وقت زیادی را صرف میکند.
راه حل:
با استفاده از Extension انگلیسی زبان Callingid که در آدرس زیر قابل دانلود میباشد کار شما بسیار کم میشود:
www.pcwelt.de/downloads/browser-netz/browser-tools/59749/index.html
برخلاف Extensionهای دیگر نصب این Extension در پنجره مرورگر نبوده بلکه مانند نرمافزارهای کاربردی توسط نرمافزار Setup نصب خواهد شد. سپس چه در IE و چه در FireFox در دسترس قرار خواهد داشت. Callingid به عنوان یک نوار ابزار در قسمت راست در کنار نوار منوی متعلق به مرورگر قرار گرفته و در قالبی کوچک صاحب صفحات وب مراجعه شده به آنها را نشان میدهد. اگر نشانگر موش را روی این قسمت نگهدارید ، اطلاعات کاملی به همراه آدرس پستی از صاحب سایت مراجعه شده به آن به شما داده خواهد شد. علاوه بر این عمل تحلیل میزان ریسک موجود در دیدن و مراجعه به سایت مورد نظر را بررسی میکند.
برای این کار نرمافزار از نکات زیادی استفاده میکند. برای مثال: کشوری که سرور در آن وجود دارد، قسمتهای تشکیل شده اسم URL، لیست مخصوص به اسامی جاسوسان معروف و پیغامهای کاربر اگر مشکلی وجود نداشته باشد، رنگ سبز و لغت Verified برای بعضی از صفحات نیز رنگ زرد ظاهر میشود که اعلام میکند این صفحه از نظر خود نرمافزار ثبات کافی ندارد اما مشکلی نیز هنوز پیدا نشده است. لغت Low Risk نیز در این حالت ظاهر خواهد شد.
برای بعضی از صفحات دیگر رنگ قرمز و لغت High Risk ظاهر میشود که اعلام میکند بهتر است به این سایت مراجعه نکنید چرا که ریسک بالایی دارد.
پس از یک بار کلیک کردن بر روی لغات ظاهر شده گزارش مفصلی از اطلاعات بدست آورده شده از این سایت به شما نشان داده خواهد شد. لیست کشورهایی که از طرف Callingid به عنوان ناامن شناخته شدهاند را میتوان تغییر داد. برای اینکار گزینههای زیر را انتخاب کنید:
Callingid-> Menu->Options->Advanced Options->Suspected Countries->Settings
توجه داشته باشید که کشورهای نام برده شده در این لیست به کلی قطع نمیشوند بلکه Callingid سرورهای وب کشورها را نیز چک میکند و آن دسته را که در کشور نام برده به عنوان مطمئن میشناسد، آزاد میگذارد.
منبع: مجله علم و الکترونیک کامپیوتر
مترجم: وهاب حاجی باقری
مشکل: اینترنت اکسپلورر از فایر فاکس سریعتر اجرا میشود. شما نیز با اینکه مرورگر Open-Source را ترجیح میدهید به دلیل عجله، از مرورگر اینترنت استفاده میکنید.
دلیل سبقت مرورگر مایکروسافت: این نرمافزار به قدری عمیق در سیستم خود را جای داده است که بلافاصله پس از Logon کردن و نشان دادن دسکتاپ سه چهارم آن لود شده است. نرمافزارهایی که جزئی از ویندوز نمیباشند نمیتوانند به این حد برسند. اما امکان قوی سازی و مجهز کردن فایرفاکس وجود دارد.
راه حل: بخش نصب فایر فاکس نرمافزاری برای شروع سریع را با خود به دنبال ندارد. این نرمافزار یا بهتر بگوییم ابزار، توسط autostart بخشهایی از نرمافزار را در پشت صحنه بارگذاری میکند.
برای این کار از Firefox Prealoader که به زبان انگلیسی میباشد و قابل دانلود در سایت زیر است وجود دارد را نصب کنید:
http://www.pcwelt.de/downloads/browser-netz/browser-tools/77189/
این ابزار از گروه فایرفاکس نمیباشد. بلکه پروژهای از گروه جداگانهای میباشد. علیرغم این مسئله ابزار بدون هیچ مشکلی حتی با نسخه جدید 2.x مرورگر نیز کار میکند.
پس از نصب Firefix Preloader خود را در گروه autostart جایداده مسیری را که فایرفاکس در آنجا نصب شده است شناخته و آیکونی را نیز در Systray از خود به جای میگذارد.
تنها به خاطر داشته باشید که در فایرفاکس حتی اگر تمامی پنجرههای مرورگر را نیز ببندید، تا زمان فعال بودن شروع کننده سریع به صورت کامل پایان نمیپذیرد.
اگر میخواهید به فایرفاکس به طور کامل پایان ببخشید. با دکمه راست موش بر روی آیکون Preloader کلیک کرده و از منوی آن گزینه Unload firefox را برگزینید. اگر صاحب چندین فایر فاکس میباشید، تنها یکی از آنها را میتوانید مجهز به شروع کننده سریع کنید. برایمشخص کردن فایر فاکس مورد نظر از میان بقیه نیاز به غیرفعال کردن شناخت خودکار میباشد.
با دکمه راست موش بر روی نماد Preloader کلیک کرده و گزینه Preloader Options را برگزینید در اینجا گزینه Automatically Find Firefox را غیرفعال کرده و در محوطه متنی پایین آن مسیر مورد نظر برای فایرفاکس را وارد کنید.
آمدن رایانه های جدید افراد بسیاری تمایل به خرید آنها پیدا می کنند پس از خرید یک رایانه جدید و سریعتر مدل قدیمی رایانه در گوشه ای انداخته میشود . بعضی از اشخاص از رایانه های لپ تاپ استفاده می کنند و می خواهند آن را با رایانه شخصی شبکه کنند . وصل کردن دو رایانه به هم از ساده ترین مباتث شبکه به تساب می آید . پس از ساخت شبکه علاوه بر امکان انتقال اطلاعات از این طریق شما می توانید از یک امکان لذت بخش دیگر نیز استفاده کنید . با شبکه شدن دو رایانه شما می توانید بازیهای مختلفی را تتت شبکه خانگی خودتان بازی کنید و از آن لذت ببرید
برای شبکه کردن دو رایانه شما اتتیاج به سخت افزار شبکه روی هر دو سیستم و به مقدار لازم کابل شبکه دارید.
بسیاری از مادربورد های جدید خودشان دارای پورت شبکه هستند .اما اگر مادربورد شما دارای سخت افزار شبکه نیست باید کارت شبکه را برای هر دو سیستم تهیه کنید انواع معمولی کارت های شبکه قیمت های بسیار مناسبی دارند و ... در تمام فروشگاهها نیز پیدا می شوند .
به جز کارت شبکه شما باید به اندازه فاصله دو رایانه کابل شبکه خریداری کنید در موقع خرید اری کابل شبکه باید تتما به فروشنده گوشزد کنید که کابل را برای اتصال تنها دو رایانه می خواهید. این مساله باعث می شود که فروشنده برای نصب فیشهای دو سر کابل رشته های آن را به نتو خاصی که مخصوص اتصال دو رایانه است دو رایانه است مرتب کند .
تتما می دانید برای شبکه کردن بیش از دو رایانه اتتیاج به سخت افزارهای دیگری مثل سیستم ارتباط مرکزی یا هاب HUB نیاز می باشد .نتوه چیده شدن رشته های کابل شبکه برای اتصال به HUB و شبکه کردن بیش از دو رایانه متفاوت می باشد.
پس از خرید این وسایل تالا باید شما کارتهای شبکه را روی سیستم ها نصب کنید این کارتها معمولا با استفاده از درایورهای خودشان به راتتی نصب می شوند بعد از نصب کارت های شبکه در قسمت Network Connections ویندوز شما گزینه ای با عنوان Local Area Connections اضافه می شود تالا کابل را به کارت های شبکه دو رایانه وصل کنید و هر دو رایانه را تتت ویندوز XP روشن نمایید .
در این مرتله برای درست کردن شبکه روی گزینه MY Computer هر دو رایانه کلیک راست کرده و گزینه Properties را انتخاب نمایید. تالا به قسمت Computer Name بروید هر دو رایانه باید دارای Workgroup یکسانی باشند .برای یکسان کردن آنها روی گزینه Change کلیک کرده و سپس اسمی را برای Workgroup هر دو رایانه وارد نمایید.تتما دقت نمایید که Computer Name های هر دو رایانه باید متفاوت باشد . تالا روی هر دو رایانه به قسمت Network Connections بروید و روی Local Area Connections کلیک کنید و Properties را انتخاب کنید و در پنجره باز شده دنبال خطی با عنوان Protocol TCP/internet بگردید این خط را انتخاب نموده و روی گزینه Properties کلیک نمایید معمولاگزینه Obtain Automatically an ip Address به عنوان پیش فرض انتخاب شده است .شما گزینه Use The Following ip Address را انتخاب کنید ، در قسمت ip Address یکی از رایانه IP را 192.168.0.1 و در رایانه دیگر 192.168.0.2 وارد نموده ، در قسمت Subnet Mask هر دو رایانه این مقدار را وارد نمایید : 255.255.255.0 تالا دیگر کار شبکه شدن رایانه ها تمام شده است هر دو رایانه را برای اطمینان مجددا راه اندازی کنید .
به یاد داشته باشید که درایو ها و پوشه هایی را که می خواهید در هر رایانه روی شبکه قرار بگیرد را باید Share کنید برای این کار : روی درایو ها و پوشه ها کلیک راست کرده و گزینه Properties را انتخاب کنید در قسمت Sharing این پنجره شما باید گزینه share this folder را انتخاب کنید .
منبع : کامیاب آنلاین
در صورتی که شما نیز همانند بسیاری از کاربران دیگر اینترنت برای بهره گیری از سرویس ایمیل ، Gmail را انتخاب کرده باشید ، ممکن است دوست داشته باشید تا از این پس ایمیل هایی که از جانب فرد یا سایت خاصی که معمولأ به طور روزانه برای شما ایمیل ارسال میکند را برای حفظ نظم سرویس ایمیل خود دسته بندی کنید. بدین شکل که ایمیل از جانب فرد یا سایت به طور اتوماتیک در یک دسته خاص قرار گیرد. در این ترفند قصد داریم به معرفی این روش به طور ساده در Gmail بپردازیم.
برای این کار کافی است وارد محیط Gmail شوید .
حال در کنار کادر جستجو ، بر روی گزینه Create a filter کلیک کنید و یا به بخش Setting رفته و سپس بر روی زبانه Filters کلیک کرده و سپس عبارت Create a new filter را برگزینید.
حال در صفحه ای که به چشم می خورد ، می توانید عبارتی که مد نظر شماست را با توجه به ایمیلهای خود در کادر های مختلف وارد کنید .
با کلیک بر روی دکمه Test Search می توانید نتایج را بلافاصله مشاهده کنید .
شما می توانید تنها یکی از کادرهای فوق و یا چندین کادر مختلف را پر کنید .
حال با کلیک بر روی دکمه Next Steps به مرحله بعد بروید .
حال در پنجره موجود می توانید نتایج را بنا به دلخواه خود تنظیم کنید .
Skip the Inbox = ایمیلهایی که دارای خصوصیات تعریف شده باشند را درInbox ایمیل شما نمایش نخواهد داد و تنها در دسته بندی که تعیین می کنید جمع اوری خواهد شد (Labels)
Star it = ایملیهای تعریف شده را ستاره دار خواهد کرد .
Apply the label = ایملیهایی که دارای خصوصیات تعریف شده باشند را در یک Label خاص قرار خواهد داد .
Forward it to = ایمیلهای فوق را به یک آدرس ایمیل دیگر Forward می کند .
Delete it = نیز ایمیلهای ذکر شده را به صورت اتوماتیک حذف می کند .
همچنین با انتخاب گزینه Also apply filter to نیز نتایجی که در مرحله قبل یافت شده اند نیز شامل این اعمال قرار خواهند گرفت ؛ در غیر این صورت تنها ایمیلهایی که از این به بعد دارای خصوصیات فوق باشند شامل عمل Filter قرار خواهد گرفت .
از آنجایی که قصد ما تنها جمع آوری یکسری ایمیل خاص بود لذا گزینه Apply the Lable را انتخاب کرده و یک Label تعیین می کنیم .
حال در صفحه اصلی Gmail ، در کادری که در سمت چپ به چشم می خورد با کلیک بر روی Label خودتان می توانید ایمیلهای مربوطه را مشاهده کنید . همچنین در صورت وجود ایمیل خوانده نشده ای در هر Label عددی در مقابل label به چشم خواهد خوvد که نشان دهنده تعداد ایمیلهای خوانده نشده است.
منبع: کامیاب آنلاین
بسیاری از کاربران وقت زیادی را در موتورهای جستجو و وب سایت های مختلف صرف میکنند تا آهنگ های مورد علاقه خودشان را به شکل رایگان از طریق اینترنت دانلود کنند. در این ترفند قصد داریم یک ترفند جالب را به شما معرفی کنیم که با استفاده از آن میتوانید آهنگ های مورد علاقه خودتان را با فرمتهای مختلف از موتور جستجوی گوگل و بدون دردسر دانلود کنید.
وارد موتور جستجوی گوگل بشوید. (www.Google.com)
اکنون دستور زیر را در قسمت جستجو وارد کنید:
intitle:index.of? Format Kamyabonline
اکنون میبایست پارامترهای جستجو را جایگزین کنید:
در دستور فوق به جای واژه " Kamyabonline " میبایست نام خواننده مورد نظر را تنها به زبان انگلیسی وارد کنید.
به جای واژه " Format " نیز بایستی فرمت مورد نظر آهنگ را تعیین کنید.
برای درک بیشتر یک مثال میزنیم:
در صورتی که به دنبال یک آهنگ از خواننده ای به نام OMID باشیم میبایست به جای Tarfandestan عبارت OMID را وارد کرده و به دنبال آهنگ با فرمت MP3 باشیم به جای واژه Format عبارت MP3 را تایپ میکنیم ، پس میشود:
intitle:index.of? Mp3 Omid
حالا Enter میزنیم تا جستجو انجام شود.
اکنون در صفحه جستجو میتوانید نتایج را داشته باشید ، با ورود به هر نتیجه جستجو لیست آهنگ ها موجود است. کافی است روی نام آهنگ کلیک کنید و منتظر دانلود آهنگ بمانید.
چندین مثال دیگر:
intitle:index.of? Mp3 Chavoshi
intitle:index.of? WMA Eminem
intitle:index.of? WMA Shadmehr
زمانى که اسپایدر spider یک صفحه HTML را مشاهده مى کرد
زمانى که spider گوگل یک صفحه HTML را مشاهده مى کرد، به دو نکته توجه مى کرد: کلمات درون صفحه، در کجا کلمات پیدا شده اند. کلماتى که در عنوان اصلى یا عناوین فرعى و یا سایر موقعیت هایى که داراى اهمیت نسبى هستند، قرار دارند براى جست وجوى بعدى کاربر مورد توجه خاص قرار مى گرفتند. spider گوگل هر کلمه معنى دارى در صفحه را فهرست مى کرد و از کلمات a an, the صرف نظر مى کرد. سایر spider ها از روش هاى متفاوتى استفاده مى کردند. در کل تمامى این روش ها معمولاً سعى مى کند تا عملکرد spider را سریع تر کند، به کاربران اجازه بدهد تا با کارایى بهتر و بهینه تر جست وجو کنند و یا هر دو آنها. به عنوان مثال، بعضى spider ها کلماتى که در عنوان ها، عنوان هاى فرعى و لینک ها وجود دارند یا کلماتى که بارها در صفحه تکرار مى شوند و هر کلمه اى در بیست خط اولیه متن را نگهدارى مى کند. سایت Lycos از این روش استفاده مى کند. سایر سیستم ها، از قبیل AltaVista، هر کلمه در صفحه، شاملa an, the و سایر کلمات که بى اهمیت هستند را هم لیست مى کنند.
ایجاد فهرست
ایجاد فهرست زمانى که spider ها وظیفه یافتن اطلاعات از صفحات شبکه را به اتمام رساندند (البته باید در نظر داشته باشیم که این وظیفه هرگز واقعاً تمام نمى شود، خاصیت تغییر دائمى شبکه به این معنى است که spiders ها همیشه در حال حرکت و جست وجو هستند)، موتور جست وجو باید این اطلاعات را به شکلى که مفید باشد، ذخیره کند. دو مولفه کلیدى براى در دسترس قرار دادن اطلاعات جمع آورى شده براى کاربران وجود دارد: اطلاعات ذخیره شده با داده ها - روشى که توسط آن اطلاعات فهرست مى شود. در آسان ترین حالت، موتور جست وجوگر مى تواند تنها کلمه و URL را ذخیره کند. در حقیقت، این روش براى موتورى با کاربرد محدود است، زیرا در این حالت راهى وجود ندارد براى اینکه تعیین کند آیا کلمه در بخش مهم یا بخش بى اهمیتى از صفحه استفاده شده است، آیا کلمه تنها یک بار یا چندین مرتبه تکرار شده است یا صفحه لینک هایى به صفحات دیگرى که شامل آن کلمه هستند، دارد. به عبارت دیگر راهى براى ایجاد لیستى رتبه بندى شده که تلاش مى کند تا مفیدترین و بهترین صفحات را در بالاى لیست نتایج جستجو قرار بدهد، وجود ندارد.
حرکت به سوی کارایی بهتر در موتورهای جستجو
براى به دست آوردن نتایج بهتر، بیشتر موتورهاى جست وجو اطلاعات بیشترى علاوه بر کلمه و URL ذخیره مى کنند. موتور ممکن است تعداد دفعاتى که کلمه در صفحه تکرار شده است را ذخیره کند، یا ممکن است مقدارى را به هر ورودى اختصاص بدهد و زمانى که کلمات در عناوین، عنوان هاى فرعى و لینک ها ظاهر مى شوند ارزش اختصاص یافته به آنها بیشتر مى شود. هر موتور جست وجوگر تجارى، فرمول متفاوتى براى ارزش گذارى کلمات فهرست خود دارد. این مسئله یکى از دلایلى است که موجب مى شود جست وجوى یک کلمه در موتورهاى جست وجوگر متفاوت، لیست هاى متفاوتى را ارائه بدهد و صفحاتى با ترتیب هاى متفاوت ارائه شود. داده ها براى صرفه جویى در فضاى ذخیره سازى رمزگذارى مى شوند. مثلاً در صفحه گوگل اطلاعاتى از قبیل اینکه آیا کلمه با حروف بزرگ بوده است، اندازه فونت آن، موقعیت کلمه و سایر اطلاعاتى که به رتبه بندى آن کمک مى کند را به صورت بیت و بایت ذخیره مى کند. در نتیجه میزان بسیار زیادى از داده ها مى تواند به شکل بسیار فشرده اى ذخیره شود. بعد از اینکه اطلاعات فشرده شد، براى فهرست شدن آماده است. هدف از ایجاد یک فهرست این است که باعث شود تا بتوانیم اطلاعات را با سریع ترین حالت ممکن پیدا کنیم.
ایجاد فهرست وبسایتها در موتور جستجو
به طور کل، تنها چند راه براى ایجاد فهرست وجود دارد، اما یکى از مهمترین و موثرترین روش ها، ایجاد جدول hash است. در این روش فرمولى به کار مى رود تا به هر کلمه یک ارزش عددى اختصاص بدهد. پرسش و جست وجوى انجام شده توسط کاربر مى تواند خیلى ساده باشد، حتى یک کلمه. براى پرسش هاى پیچیده تر لازم است تا از عملگرهاى بولین (AND, OR, NOT, NEAR,) و... استفاده کنید تا بتوانید شرایط جست وجو را گسترش بدهید.
به طور خلاصه عملکرد یک موتور جست وجو به این صورت است: نرم افزار spider با جست وجو در سایت هاى مختلف لیستى از کلمات و جایى که قرار دارند فراهم مى کند، سپس براساس سیستم ارزش گذارى خود فهرستى رتبه بندى شده تهیه مى کند، داده ها را رمزگذارى مى کند و سرانجام اطلاعات را براى دسترسى کاربران ذخیره مى کند.
در جستجوهایى که از عملگرهاى بولین استفاده مى شود، جستجوهاى لفظى است. موتور دقیقاً همان کلمات یا عبارتى که وارد شده است را جست وجو مى کند. زمانى که کلمات ورودى داراى چندین معنى هستند، جست وجوى صحیح آنها مشکل است. در این حالت، اگر براى شما تنها یکى از معانى آن کلمه مهم باشد، احتمالاً شما نمى خواهید سایر صفحات را که شامل معانى دیگر کلمه است ببینید. شما مى توانید یک جست وجوى لفظى ایجاد کنید که تا حدودى معنى هاى ناخواسته را حذف کند، اما بهتر این بود که خود موتور جستجو مى توانست این کار را انجام بدهد. یکى از حوزه هاى تحقیق در موتورهاى جست وجوگر، جست وجو براساس مفهوم است. به عنوان مثال، استفاده کردن از تحلیل هاى آمارى صفحاتى که شامل کلمات یا عباراتى است که شما جست وجو مى کنید، براى اینکه صفحات دیگرى را که ممکن است شما به آن علاقه داشته باشید پیدا کند. بدیهى است که در یک موتور جست وجوگر مبتنى بر مفهوم، اطلاعات ذخیره شده براى هر صفحه، بیشتر است. هنوز بسیارى از گروه ها تلاش مى کنند تا نتایج و عملکرد این نوع از موتورهاى جست وجو را افزایش دهند. قلمرو دیگرى که پژوهشگران درباره آن تلاش مى کنند، پرسش ها به زبان طبیعى نامیده مى شود. منظور از این پژوهش این است که شما بتوانید پرسش تان را به گونه اى تایپ کنید مثل اینکه آن را از شخصى که کنار شما نشسته است مى پرسید و نیازى نباشد تا از عملگرهاى بولین یا ساختارهاى پیچیده براى پرسش استفاده کنید.
سخن آخر
معروف ترین سایت جست وجو به شیوه پرسش به زبان طبیعى، سایت AskJeeves.com است. این سایت تنها با جملات ساده کار مى کند، اما تلاش بسیارى انجام مى شود تا این روش جست وجو گسترش یابد تا بتواند سئوالات پیچیده تر را هم بپذیرد. همچنان تلاش هاى بسیارى براى افزایش کیفیت و ارائه خدمات بیشتر موتورهاى جستجوگر انجام مى شود و هر روز شاهد خبرهاى جدیدى در این زمینه هستیم و رقابت بین سایت هاى داراى موتور جستجوگر بیشتر و بیشتر مى شود.
ایران جدید ایرانیو
در خصوص چگونگی انجام این مهم یعنی پیدا کردن یک کلمه یا ترکیبی از کلمات توسط یک موتور جستجو مقالات متعددی درج نموده ایم . مقاله ای که پیش رو است به قلم شیوا یکی از همکاران و وبلاگنویسان است که با زبانی ساده و به دور از مسایل فنی به ما خواهد آموخت چگونه در عرض چند ثانیه موتور جستجو در میان میلیونها صفحه انبوهی از اطلاعات را در اختیار کاربرمی گذارد
جستجو میان صدها میلیون صفحه
شیوه عملکرد موتورهاى جست وجوى
تفاوت هایى در شیوه عملکرد موتورهاى جست وجوى مختلف وجود دارد، اما همه آنها سه وظیفه اصلى را انجام مى دهند:
در اینترنت، یا بخش هاى برگزیده اى از اینترنت، براساس کلمات مهم جستجو را انجام مى دهند.
یک فهرست از کلماتى که پیداکرده اند و جایى که آنها را پیدا کرده اند، تهیه مى کنند.
این امکان را براى کاربران فراهم مى کنند تا کلمات یا مجموعه اى از کلمات مورد نظر خود را که در فهرست یافت مى شود جست وجو کنند.
موتورهاى جست وجوى اولیه یک فهرست شامل تنها چندصد هزار صفحه و فایل نگهدارى مى کردند و در روز شاید یک یا دو هزار بازدیدکننده داشتند. امروزه یک موتور جست وجوى خوب، صدها میلیون صفحه را فهرست مى کند و در روز پاسخگوى ده ها میلیون جست وجو کننده است. حالا باید ببینیم چگونه این مسئولیت مهم انجام مى شود و چگونه موتورهاى جست وجوى اینترنتى، بخش هاى مختلف را به کار مى برند تا ما بتوانیم اطلاعات مورد نیاز خود را در شبکه بیابید. جستجو میان صدها میلیون صفحه قبل از اینکه یک موتور جستجوگر بتواند به شما بگوید که یک فایل در کجا قرار دارد، باید آن فایل پیدا شود.
روبات اسپایدر spiders
یک موتور جست وجوگر براى یافتن اطلاعات از میان صدها میلیون صفحه که در شبکه وجود دارند، روبات نرم افزارى خاصى به نام spiders را به کار مى گیرد تا لیستى از کلماتى که در سایت هاى شبکه یافت مى شود را ایجاد کند. فرآیندى که یک spider لیست خود را ایجاد مى کند، Web crawling نامیده مى شود. براى ایجاد و نگهدارى یک لیست مفید و مناسب از کلمات، یک spider موتور جست وجوگر باید صفحات بسیار زیادى را بررسى کند. چگونه هر spider مسیرش را در شبکه آغاز مى کند ؟ معمولاً نقطه شروع، لیستى از صفحاتى است که توسط سرورها زیاد استفاده مى شوند و همچنین صفحاتى که مومى تر و معروف تر هستند.
طرز عملکرد یک اسپایدر spiders
spider از یک سایت عمومى شروع مى کند، کلمات موجود در صفحات آن را لیست مى کند و هر لینکى که در آن سایت یافت مى شود را دنبال مى کند. به این طریق سیستم جست وجوگر به سرعت شروع به حرکت مى کند و در بخش هایى که بیشتر از همه مورد استفاده قرار مى گیرد حرکت مى کند. Google.com به عنوان یک موتور جست وجوگر علمى آغاز به کار کرد. سرجى برین و لورنس پیج بیان کرده اند که spiderهاى سیستم آنها با چه سرعتى مى توانند کار کنند. آنها سیستم اولیه خود را به گونه اى ساختند که از چندین spider استفاده کند، معمولاً سه تا در یک زمان. هر spider مى توانست با حدود سیصد صفحه شبکه که در یک زمان باز بودند اتصال برقرار کند. در بهترین عملکرد خود، با استفاده از چهار spider، این سیستم مى توانست در هر ثانیه به صد صفحه متصل باشد و حدود ??? کیلو بایت داده را در هر ثانیه ایجاد کند. براى سرعت بخشیدن به جست وجو، ایجاد سیستمى براى ارائه اطلاعات لازم به spider لازم است. سیستم گوگل اولیه داراى سرورى بود که به فراهم کردن URL ها براى spider ها اختصاص یافته بود. به جاى وابسته بودن به یک فراهم کننده سرویس اینترنتى براى DNS که نام یک سرور را به یک آدرس تبدیل مى کند، گوگل DNS خودش را داشت تا تاخیرها را به حداقل برساند.
منبع: انجمن اطلاعات و فن آوری ایران
مبانی جستجوی گوگل:
وقتی شما چند کیورد (Keywords) را با هم جستجو میکنید، یک موتور جستجو یک استراتژی از پیش تعیین شدهای برای بررسی و ترکیب کیوردهای شما دارد. آیا هر یک از کیوردها میتوانند به تنهایی در هر جای صفحه وجود داشته باشند یا باید کنار هم قرار گرفته باشند؟ آیا موتور جستجو کلمات کلیدی را با هم جستجو میکند یا تکتک؟
جستجوی یک عبارت:
گوگل به صورت پیشفرض، کلمات کلیدی شما را در هر کجای صفحه، چه کنار هم باشند و چه به صورت پراکنده، جستجو میکند. برای تغییر نتایج صفحات با کلمات مرتب شده موردنظر ما، آنها را در بین دو کوتیشن قرار میدهیم.
برای جستجوی کیوردهای زیر:
to be or not to be
گوگل کیوردها را در هر جای صفحه که آمده باشند، پیدا خواهد کرد. اگر شما میخواهید تنها نتایجی را ببینید که کیوردها با هم و به عنوان یک عبارت در صفحه آمدهاند، آنها را در بین دو کوتیشن قرار دهید:
"to be or not to be"
گوگل در این حالت تنها نتایجی را نشان میدهد که کیوردها با هم ظاهر شدهاند. البته گوگل کلماتی مثل «or» و «to» را در این حالت جستجو نمیکند.
جستجوی عبارت به این روش همچنین زمانی مفید است که شما میخواهید عبارتی را بیابید، اما مطمئن نیستید که جملهبندی عبارت مورد نظر شما درست باشد که این مطلب که مکمل این قسمت است در بخش Full-Word Wildcards شرح داده شده است.
اساس بول
یک موتور همه کیوردها یا هر یک از آنها را جستجو میکند که بر اساس پیشفرض بولی صورت می گیرد. موتورهای جستجو می توانند از AND برای جستجوی همه کیوردها یا OR برای جستجوی هر کلمه استفاده کنند.
در نتیجه حتی اگر موتو جستجو به صورت پیش فرض همه کیوردها را جستجو کند شما می توانید معمولا به آن یک دستور خاصی بدهید تا آنرا برای یافتن هر کیورد راهنمایی کنید.
پیش فرض بولی گوگل AND است، یعنی اگر شما کلماتی را بدون اصلاح کننده ها جستجو نمایید همه کلمات شما را با هم جستجو می نماید.
به عنوان مثال اگر شما برای کلمات زیر جستجو کنید:
snowblower Honda "Green Bay"
موتور، جستجو را برای همه کیوردها باهم انجام میدهد. اگر شما مایلید که مشخص کنید که هر کدام از کلمهها یا عبارات قابل قبول است یک OR بین هر کدام قرار دهید:
snowblower OR snowmobile OR "Green Bay"
اگر شما اصطلاحی را به همراه یک یا دو اصطلاح دیگر میخواهید، آنها را در پرانتز قرار دهید مثل:
snowblower (snowmobile OR "Green Bay")
میتوانید جستجو برای کلمه snowmobile یا عبارت "Green Bay" به همراه کلمه Snowblower را با پایپ که معادل OR است به صورت زیر جستجو کنید که علامت | پایپ نامیده میشود:
snowblower (snowmobile | "Green Bay")
خنثی سازی:
اگر شما مایلید که آیتمی در جستجوی شما ظاهر نشود قبل از آن – قرار دهید:
snowblower snowmobile -"Green Bay"
موتور در این حالت صفحاتی را که شامل snowblower snowmobile هستند و "Green Bay" را در بر ندارند خواهد یافت. نکته ای که باید به آن توجه کرد، علامت – باید درست قبل از کلمه ای که شما آن را در نتایج نمیخواهید، باید قرار بگیرد اگر از فاصله نیز استفاده شود دیگر این دستور جواب نمیدهد.
ترفندهای جستجو در گوگل (قسمت دوم)
دخالت آشکار:
روی هم رفته گوگل برای تمام کیوردها و عباراتی که شما مشخص میکنید، جستجو را انجام خواهد داد (به جز آنهایی که شما با علامت – آنها را نادیده گرفتهاید) گرچه کلمات معینی وجود دارد که گوگل آنها را به دلیل رواج زیاد در جستجو نادیده میگیرد. این لغات به شرح زیر هستند که لغات توقف نامیده میشوند.
"I", "a", "the", "of"
شما میتوانید با اضافه کردن کاراکتر + گوگل را وادار کنید که کلمات توقف را نیز در نظر بگیرد:
+the king
همچنین کلمات توقفی که داخل عبارت کوتیشندار نوشته میشوند، نادیده گرفته نمیشوند مثل:
"the move" glam
که نتایجی دقیقتر از نتیجه زیر دارد:
the move glam
طبعا به خاطر اینکه گوگل کلمه the را در جستجوی اول در نظر گرفته است، اما در دومی آنرا نادیده گرفته است.
مترادفها:
گاهی اوقات شما احساس میکنید که شما از بعضی نتایج مفید بیبهره ماندهاید، زیرا کیورد یا کیوردهایی که شما انتخاب کردهاید، تنها راه بیان آنچه که به دنبالش هستید، نیستند. اپراتور مترادف گوگل کاراکتر ~ است که زمانی که هر تعداد کیورد در جستجوی شما بیاید از گوگل میخواهد که تنها معادلهای دقیق را در نظر نگیرد، بلکه آنچه گوگل فکر میکند که هممعنی و مترادف کیوردها هستند را نیز، در بر گیرد.
مثل جستجو برای:
~ape
که نتایجی را با کلماتی از قبیل میمون، گوریل، شانپانزه و ... (چه به صورت مفرد و چه به صورت جمع) در بر خواهد داشت که میمون یا خویشاوندان متناسب با او را در بر دارد چنانکه گویا شما سرچ کردهاید برای:
monkey gorilla chimpanzee
که حتی شامل بعضی چیزها است که حتی فکرش را هم نمیکردید. گوگل به صورت الگوریتمی مترادفها را میشناسد بنابراین شما از یافتن نتایجی از کلماتی نزدیک، که حتی گنجینه لغات شما آنها را در بر ندارد، شگفت زده خواهید شد. (مترادفات به صورت حروف ضخیم که نزدیک کلمه مورد نظر شما در صفحه نتایج است، نشان داده میشوند. بنابراین به راحتی قابل تشخیصاند.)
رنج عددی:
یکی از مشکلترین چیزها برای نشان دادن در یک جستجوی اینترنتی مقادیر تاریخ و پول و اندازه و وزن و ارتفاع یا هر جفت ارزش اختیاری است.
اپراتور مقادیر عددی که .. است نتایجی را که در مقادیر عددی معین شده جستجو مینماید. آیا به دنبال یک جفت پمپ پرادا با سایز 5 یا 6 هستید؟ این یکی را برای سایز امتحان کنید:
prada pumps size 5..6
شاید شما به دنبال هزینه کرئن 800 تا 1000 دلار برای یک دوربین دیجیتال قشنگ اسالآر هستید، سرچ کنید برای:
slr digital camera 3..5 megapixel $800..1000
یک چیزی که باید به خاطر داشت این است که همیشه یکسری راهنما را به عنوان معنی مقادیر تامین نمایید، مثل سایز یا مگاپیکسل یا کیلوگرم و ... شما همچنین میتوانید دستور مقدار عددی را فقط با یک عدد به کار ببرید که آنرا به مینیمم یا ماکزیمم عبارت تبدیل میکند. آیا شما میخواهید خشکی مانتانا که حداقل 500 زمین است بیابید؟ مشکلی نیست:
acres Montana land 500..
جستجوی آسان و جست و جوی با بخت و اقبال:
کلید جستجوی با بخت و اقبال چیز قشنگی است. در برابر دادن یک لیست نتایج جستجو که انتخاب میشوند و به شما داده میشوند. شما با جاروب آنچه گوگل فکر می کند که بیشتر برای داده جستجو شده شما متناسبند، مواجه خواهید بود. کلمه واشنگتن پست را تایپ کنید و دکمه جستجو با بخت و اقبال را بزنید که شما را مستقیم به washingtonpost.com میبرد و اگر کلمه پریزیدنت را تایپ کنید شما را مستقیم به سایت whitehouse.gov میبرد.
حساسیت به وضعیت:
بعضی موتورهای جستجو نسبت به وضعیت حروف حساس هستند، اما گوگل حساس به آن نیست و حروف زیر همگی برای گوگل یکسانند:
Three, three, ThrEE, ThrEE
ترفندهای جستجو در گوگل (قسمت سوم)
بعضی از موتورهای جستجو تکنیکی به نام Stemming را پشتیبانی میکنند که تکنیکی است که معمولا با اضافه کردن * یا گاهی ؟ به عبارت موردنظر از موتور جستجو درخواست میکند که به جای این علامت، مشتقات آنرا جستجو کند.
به عنوان مثال جستجوی moon* نتایجی مثل moons, moonlight, moonshot را در برخواهد داشت.
گوگل از این ویژگی به طور صریح استفاده نمیکند. ولی زمانی که شما جای یک کلمه را در عبارتی نمیدانید، میتوانید از * استفاده کنید که از این ستاره به معنای جانشین یک کلمه کامل در گوگل، برداشت میشود. بنابراین طبق گفته های بالا جستجو برای "three * mice" موارد زیر را در نتایج خواهد داشت:
finds three blind mice, three blue mice, three green mice,
چقدر این ویژگی گوگل بدرد میخورد؛ مطمئنا به اندازه ویژگی stemming مفید نیست ولی بازهم موجب گیج شدن مبتدیان نمیشود. یک * یک جانشین برای یک کلمه است، دو * به معنای دو کلمه و ...
این ویژگی در موارد زیر قابل استفاده است:
1- فائق آمدن بر محدودیت 10 کلمه گوگل ( در گوگل عبارتهایی که بین دو کوتیشن قرار میگیرد، نباید بیش از 10 کلمه باشد) شما این مثالها را (مثلا عبارت Fourscore and seven years ago, our fathers brought forth on this continent) که زیاد برای پیدا کردن یک شعر یا نقل قول تکرار میشوند را، اگر امتحان کنید، گوگل تنها تا کلمه on عمل جستجو را انجام خواهد داد و همه آنچه بعد از آن میآید، توسط گوگل نادیده گرفته میشود.
2-بررسی تکرار یک عبارت معین یا مشتق عبارت مثل: (درباره دستور اینتایتل بعدا توضیح داده خواهد شد)
intitle:"methinks the * doth protest too much"
و یا
intitle: "the * of Seville"
3- پر کردن جاهای خالی حافظه یک آدمحواسپرت! شاید شما فقط یک قسمت کوتاه یک ترانه را به یاد بیاورید که جستجو تنها از آنچه شما به یا میآورید، به جای بازسازی تصادفی استفاده میکند.
بیایید یک مثالی را مرور کنیم، سرود "Good Times" که توسط چیک سروده شده است، که خط زیر را بیان میکند:
"You silly fool, you can"t change your fate."
شاید شما یک ترانه را گوش کردهاید، اما شما یادتان نمی اید که کلمه fool درست است یا چیز دیگری بوده، اگر شما اشتباه کرده باشید ( اگر درستش به عنوان مثال "You silly child, you can"t change your fate" باشد) شما هیچ جوابی نخواهید یافت.
راه حل استفاده از ویژگی گوگل است که به جای آن کلمه سرچ کنیم:
"You silly *, you can"t change your fate"
شما این تکنیک را میتوانید برای نقلقولها و شعرهای غنایی و ... به کار ببرید، شما باید حواستان را جمع کنید که به اندازه کافی از متن نقلقول را سرچ کنید تا به یک نتیجه واحد برسید. مثلا عبارت زیر که قسمتی از مثال بالاست نتایج زیادی در بر خواهد داشت:
"you * fool"
ترفندهای جستجو در گوگل (قسمت چهارم)
دستورات و المانهای خاص:
علاوه بر OR و AND و جستجوهای عبارتی، Google دستورهای خاص زیادی را برای محدود نمودن جستجوی شما فراهم نموده است.
همانند همه موتورهای جستجوی Full Text، در گوگل به جای اینکه صفحات وب تنها بر اساس عنوان و توضیحات انها ایندکس شوند، صفحات وب کلا ایندکس میگردند. دستورهای خاص به کاربران گوگل اجازه میدهند که جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو
نمایند، و این اجازه را به کاربران گوگل میدهند که بتوانند جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو نمایند (که آنها اپراتورهای پیشرفته نیز نامیده میشوند). این ویژگی (دستورات و المانهای خاص) خیلی چارهساز است مخصوصا زمانی که شما با بیش از 8 بیلیون صفحه وب مواجهید و میخواهید دامنه جستجوی خود را محدودتر نمایید!
مثلا ذکر اینکه اینکه کلمات عبارت مورد نظر شما تنها بایستی در عنوان یا URL صفحات وب باشد، میتواند کمک شایانی به شما برای به دست
اوردن نتایج بسیار خاص داشته باشد. در ادامه مطلب به شرح برخی از المانهای دستوری معمول خواهیم پرداخت:
intitle:
این المان جستجوی شما را به عنوان صفحات وب محدود میکند و متغیر allintitle: صفحاتی که عنوانشان تمام کلمات ذکر شده جستجو را دربردارد را پیدا میکند و هر دو دستور، قبل کیوردها استفاده میشوند.
intitle:"windows xp"
allintitle:"windows xp" microsoft
همچنین ممکن است شما ترجیح دهید از دستور allintitle: استفاده نکنید، چون در ترکیب با دستورات دیگر ممکن است خوب کار نکند.
site:
این دستور به کاربر اجازه میدهد که جستجوی خود را به یک سایت محدود نماید.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
نکته ای که تذکرش لازم است ایناست که این دستور، دستور خوبی برای یک وبسایتی که شامل زیرشاخههایی (مثل /~sam/album/ ) است، نمیباشد. مثلا شما نمیتوانید با دستور site: همه صفحات را در http://www.geocities.com/test/test1/6485 بیابید و گوگل هیچ
نتیجهای برای جستجوی شما نخواهد یافت. به جای این دستور، دستور inurl: پیشنهاد میشود.
inurl:
این دستور جستجوی شما را به URL صفحات وب محدود میکند. این دستور برای یافتن صفحات help بسیار خوب کار میکند، زیرا آنها نسبتا در
ساختار خود منظماند و allinurl: متغیری است که همه کلمات لیست شده در URL را پیدا میکند ولی در ترکیب با دستورت دیگر خوب کار نمیکند.
inurl:help
allinurl:search help
همانطور که میبینید استفاده inurl: به جای site: یک مزیت ضروری دارد و آن اینست که شما میتوانید از آن برای جستجوی سابدایرکتوریها (زیرفهرستها) نیز استفاده نمایید.
تذکر: در استفاده از دستور inurl: برای داشتن نتایج بیشتر از //:http استفاده نکنید.
همچنین شما میتوانید inurl: را در ترکیب با site: به کار برید تا بتوانید اطلاعات سابدامینها (زیردامنهها) را استخراج نمایید. برای مثال opensource.org چند تا سابدامین دارد؟ یک جستار سریع به شما کمک میکند تا به پاسخ این جواب برسید:
site:opensource.org -inurl:www.opensource.org
این جستجو از گوگل میخواهد تا تمام صفحات دامنه opensource.org را لیست کند، اما صفحاتی را که از زیر دامنه معمول www هستند و شما آنها را قبلا دیده بودید، نادیده بگیرید.
link:
این دستور فهرستی از صفحاتی که به URL تعیین شده لینک دادهاند را، مییابد. اگر link: را وارد کنید شما به فهرستی از صفحاتی که به
صفحه گوگل لینک دادهاند، دست مییابد ( نه در هر جای دامنه google.com ) نگران نباشید اگر ادرس شما با //:http همراه نباشد، شما
به آن نیازی ندارید. بنابراین اگر ادرس شما //:http هم داشت، باز گوگل آنرا نادیده میگیرد. این دستور به خوبی با هر URL با محتوای بزرگ کار
میکند. مثلا سرعت جستجویش در http://www.opensource.org/test/test1 فرقی با بالاترین مرتبه سایت، مثل opensource.org ندارد.
cache:
این دستور یک کپی از صفحهای که در گوگل ایندکس گذاری شده است را، مییابد. حتی اگر آن صفحه دیگر در URL اصلی در دسترس نباشد یا
محتوایش به کلی تغییر کرده باشد.
cache:www.yahoo.com
catch گوگل مخصوصا برای باز یافتن نگارش قبلی یک صفحه که بارها تغییر میکند، مناسب است.
daterange:
این دستور جستجوی شما را به تاریخ به خصوصی یا یک محدوده تاریخی که صفحه در گوگل ایندکس گذاری شده، محدود مینماید. باید در نظر داشت که این جستجو، کاری به تاریخی که یک صفحه ساخته شده است، ندارد و تنها بر مبنای تاریخ ایندکس گذاری در گوگل، عمل میکند.
"Microsoft" "Windows XP" daterange:2450958-2450968