موتور جستجوي محتوايي IBM به نام پروژه SAPIR search engine

SAPIR با هدف توانمند سازی موتور های جستجوگر برای جستجو بر روی محتویات سمعی و بصری پراکنده در سطح وب براي جايگزين کردن جستجوی متون و متادیتاها به صورت متمرکز تولید شده است.
امروزه جستجو هایی که تحت وب صورت میگیرد تماما در سیطره جستجوگر های بزرگ و معتبری مانند Google ، YAHOOو یا MSN می باشد که همه آنها بر اساس یک مکانیزم فهرست بندی متمرکز و بهره جستن از عناوین این فهرست ها به علاوه امتیازاتی که هر صفحه کسب کرده به ارایه نتایج به کاربران مشغولند. نهایتا در تمامی این جستجوگر ها با اینکه امکان جستجوی مطالب صوتی و تصویری امکان پذیر است اما این جستجو ها تنها محدود به متون و متادیتاهایی است که به صورت یک حاشیه به این دسته از محتویات منتسب شده است.نکته ای که بسیار اهمیت دارد این است که برای داشتن یک جستجوگر محتوا محور جهت صدا و تصویر نیازمند یک فهم مختص رسانه هستیم و گذشته از آن با یک حجم عظیم از پردازش ها مواجه خواهیم بود که چنین گنجایشی در هیچ یک از روشهای تمرکز گرای امروزی  وجود ند ارد.
SAPIR قصد دارد تا این سد تکنولوژیکی را بشکند و با ایجاد و توسعه یک معماری وسیع و توزیع شده به صورت نقطه به نقطه امکان جستجوی صوت و تصویر را با الگوریتم جستجو بر اساس یک نمونه فراهم آورد . به عنوان مثال برای جستجوی یک بنای تاریخی ،عکسی از یک بنا که توسط یک گوشی موبایل گرفته شده برای جستجو ارسال خواهد شد با توجه به اینکه ممکن است کیفیت آن بسیار بدتر از چیزی باشد که انتظار می رود و یا اینکه یک ملودی برای جستجوی آواز کامل آن موسیقی از جستجوگر تقاضا گردد. ترکیب این اشارات و جزییات با چند متادیتای اختیاری و اطلاعات مربوط به کاربر و مفاد حاصل از شبکه های اجتماعی می تواند مرحله بعدی در بالا بردن دقت جستجوگرها در استخراج نتایج باشد.