Хочу некоторые страницы убрать из индекса (одна и та же информацию будет расположена на нескольких сайтах). Это касается исключительно товаров. Что я делаю - пишу описание, потом нажимаю "Источник" И в самом начале и конце соответсвенно ставлю теги <noindex> и </noindex>. Правильно делаю или нет?
Неправильно. Точнее можно, но очень коряво. Страницы будут учтены, но скорее всего будут засунуты в "мусор", как не несущие смысловой нагрузки. Плюс данный тег учитывается только Яндексомю По нормальному, скрывать надо всю страницу, то для такой страницы прописывать метатег: <meta name="robots" content="noindex, follow"/> (Текст страницы запрещён к индексации, однако по ссылкам робот переходить может.) Либо использовать директиву Disallow в robots.txt исключая из индекса целые директории или отдельные страницы
Страница дожна уйти из индекса, но у меня был пример когда страница снова появилась.... самый лучший способ
А лучше всего использовать rel="canonical", и тогда даже если ваша страница попадет в индекс, то робот будет знать, что она является канонической к странице-источнику.
Характеристики товаров в ИМ - могут быть не уникальными, думаю поисковики это учитывают. Да, а погинация через canonical.