Меню
Главная Услуги сайта Форум Файлы Новости Узнать свой IP Баннерообмен Скрипты от нас Турники / Брусья
Добавить новость Добавить файл


Друзья
Все для CS сайтов и системы uCozWTC-PORTAL - Новый игровой портал! Здесь есть всё для Counter-Strike, uCoz, Photoshop.. А так же много софта, игр, фильмов, музыки..
Топы
diz-cs.ru - лучший игровой ТОП сайтов! Топ сайтов ucozon.ru
Баннер 88x31
Статистика
Бесплатный анализ сайта
Онлайн всего: 1
Гостей: 1
Пользователей: 0

Посетители за сегодня
Зарегистрированных
Всего:
6697
Новых за месяц: 0
Новых за неделю: 0
Новых вчера: 0
Новых сегодня: 0
Популярные файлы на портале

УВИДЕЛИ:19771
СКАЧАЛИ:11054

УВИДЕЛИ:17350
СКАЧАЛИ:6833

УВИДЕЛИ:18613
СКАЧАЛИ:6344

УВИДЕЛИ:12085
СКАЧАЛИ:4764

УВИДЕЛИ:37793
СКАЧАЛИ:4384

УВИДЕЛИ:8969
СКАЧАЛИ:3593

УВИДЕЛИ:9515
СКАЧАЛИ:3295

УВИДЕЛИ:9861
СКАЧАЛИ:3194

УВИДЕЛИ:5542
СКАЧАЛИ:2626
Главная » Статьи » SEO, раскрутка, оптимизация » Оптимизация

Как яндекс ищет дубликаты картинок
Поиск и группировка дубликатов

Чтоб комп мог, мягко говоря, осознать, что изображено на картинах, и как раз распознать дубликаты, изображения необходимо «перевести» на понятный ему язык — язык чисел. Несомненно, стоит упомянуть то, что в Yandex.Картинах сиим как раз занимается особая, как все знают, компьютерная система, программы которой обходят, вообщем то, веб, находят изображения и обрабатывают их — выяснят, как мы привыкли говорить, нужные данные о картинке, к примеру, размер, цвет, формат (JPG, PNG и т.п.) и как раз делают числовую характеристику изображения — сигнатуру.
На каждом изображении программа, наконец, выделяет главные фрагменты. Обратите внимание на то, что потом уменьшает их до размера 16х16 пикселей, и, как все знают, каждому из 256 пикселей присваивает число, соответственное яркости этого пикселя. Мало кто знает то, что приобретенные композиции чисел и есть сигнатуры.

Программа объединяет в группы изображения, у каких есть похожие главные фрагменты (другими словами идентичны их сигнатуры). Несомненно, стоит упомянуть то, что снутри этих групп как бы выделяются еще больше близкие изображения — у каких, вообщем то, совпадают минимум два фрагмента. Как бы это было не странно, но изображения с схожими фрагментами стают кандидатами в дубликаты. Все знают то, что в их программа выделяет области, объединяющие все совпавшие фрагменты. Всем известно о том, что последующим шагом эти области уменьшаются до размера приблизительно 60х60 пикселей, переводятся в числовую характеристику и так сказать сравниваются меж как бы собой. И даже не надо и говорить о том, что дубликатами признаются изображения, у каких области, стало быть, совпадают.

Таковая организация поиска и группировки дубликатов дозволяет быстро обрабатывать наиболее 2-ух млрд изображений.

Источник: http://clan38.ru/25252356.jpg
Категория: Оптимизация | Добавил: MaraYoda (14.08.2011)
Просмотров: 243 | Теги: картинок, ищет дубликаты, Как яндекс | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Витрина ссылок
→ Купить ссылку За 2 РУБЛЯ

Поставить к себе на сайт
Выгодное предложение!
Заработок в интернете на своём
Заработок в интернете на своём сайте!
сайте!
Поиск
Теги сайта
Мини-чат
Топ файловиков

Sanek_Sayansk
Файлов:
5094

FaiLeD
Файлов:
781

vital197612
Файлов:
259

Jo0sT1q_
Файлов:
227

Руся
Файлов:
157

Масяня
Файлов:
79

MaRKeS
Файлов:
66

mY_LiFe
Файлов:
55

Mexx
Файлов:
40

assault
Файлов:
28
Софт
Внимание! Для того, что бы попросить о помощи, Вам нужно зарегистрироваться!
С ув. Администрация