robots.txt: универсальный файл для интернет-магазина на Webasyst Shop Script. Инструкция по внедрению

Ниже представлен шаблонный robots.txt для интернет-магазинов на Webasyst Shop Script. Данный шаблон robots.txt подойдет для 99% интернет-магазинов. Обратите внимание на выделенные в шаблоне строчки красным цветом: их необходимо перед размещением подкоррективать.

Чикуров Анатолий
Для тех кто хочет немного теории - есть отдельная статья на тему "Правильная настройка индексации интернет-магазина на Shop Script". Ссылка на статью.
Инструкция по внедрению robots.txt на основную витрину сайта
  1. Скопируйте себе весь код для основной витрины сайта.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: */tag/" (3 раза).
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчки "Disallow: */reviews/" (3 раза).
  4. В строчке "Sitemap: https://site.ru/sitemap.xml" укажите домен своего сайта вместо "site.ru" (3 раза).
  5. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##" (3 раза).
  6. Убедитесь, что вы внесли изменения 3 раза для каждого User-agent-а: для Yandex, для Google, и для всех остальных роботов (User-agent: *)
  7. Введите итоговый код в настройках («админка» --> «Сайт» --> «*выбрать основную витрину из списка*» --> «Настройки сайта» --> «поле "robots.txt"»
  8. Обязательно проверьте файл robots.txt на основной витрине после внесения изменений (доступен по адресу https://site.ru/robots.txt).

Шаблон robots.txt для основной витрины сайта

  1. #upd 19.09.2022
  2. #author: @anatoly_chikurov
  3. User-agent: Yandex
  4. ## googleonly usual storefronts ##
  5. Disallow: */msk/ #1
  6. Disallow: */moskva/
  7. Disallow: */spb/ #2
  8. Disallow: */novosibirsk/ #3
  9. Disallow: */nsk/
  10. Disallow: */ekb/ #4
  11. Disallow: */ekaterinburg/
  12. Disallow: */eburg/
  13. Disallow: */kazan/ #5
  14. Disallow: */nn/ #6
  15. Disallow: */chelyabinsk/ #7
  16. Disallow: */cheljabinsk/
  17. Disallow: */krasnoyarsk/ #8
  18. Disallow: */krasnojarsk/
  19. Disallow: */samara/ #9
  20. Disallow: */ufa/ #10
  21. Disallow: */rostov/ #11
  22. Disallow: */omsk/ #12
  23. Disallow: */krasnodar/ #13
  24. Disallow: */voronezh/ #14
  25. Disallow: */perm/ #15
  26. Disallow: */volgograd/ #16
  27. Disallow: */saratov/ #17
  28. Disallow: */tyumen/ #18
  29. Disallow: */tjumen/
  30. Disallow: */tolyatti/ #19
  31. Disallow: */toljatti/
  32. Disallow: */barnaul/ #20
  33. Disallow: */izhevsk/ #21
  34. Disallow: */mahachkala/ #22
  35. Disallow: */izhevsk/ #21**************
  36. Disallow: */habarovsk/ #22
  37. Disallow: */ulyanovsk/ #23
  38. Disallow: */uljanovsk/
  39. Disallow: */irkutsk/ #24**************
  40. Disallow: */vladivostok/ #25
  41. Disallow: */yaroslavl/ #26
  42. Disallow: */jaroslavl/
  43. Disallow: */kemerovo/ #27
  44. Disallow: */tomsk/ #28
  45. Disallow: */naberezhnye-chelny/ #29
  46. Disallow: */sevastopol/ #30
  47. Disallow: */stavropol/ #31
  48. Disallow: */orenburg/ #32
  49. Disallow: */stavropol/ #33
  50. Disallow: */novokuzneck/ #34
  51. Disallow: */ryazan/ #35
  52. Disallow: */rjazan/
  53. Disallow: */balashiha/ #36
  54. Disallow: */penza/ #37
  55. Disallow: */cheboksary/ #38
  56. Disallow: */lipeck/ #39
  57. Disallow: */kaliningrad/ #40
  58. Disallow: */astrahan/ #41
  59. Disallow: */tula/ #42
  60. Disallow: */kirov/ #43
  61. Disallow: */sochi/ #44
  62. Disallow: */kursk/ #45
  63. Disallow: */ulan-udeh/ #46
  64. Disallow: */tver/ #47
  65. Disallow: */magnitogorsk/ #48
  66. Disallow: */surgut/ #49
  67. Disallow: */bryansk/ #50
  68. Disallow: */brjansk/
  69. Disallow: */ivanovo/ #51
  70. Disallow: */yakutsk/ #52
  71. Disallow: */jakutsk/
  72. Disallow: */vladimir/ #53
  73. Disallow: */simferopol/ #54
  74. Disallow: */belgorod/ #55
  75. Disallow: */nizhnij-tagil/ #56
  76. Disallow: */kaluga/ #57
  77. Disallow: */chita/ #58
  78. Disallow: */groznyj/ #59
  79. Disallow: */volzhskij/ #60
  80. Disallow: */smolensk/ #61
  81. Disallow: */podolsk/ #62
  82. Disallow: */saransk/ #63
  83. Disallow: */vologda/ #64
  84. Disallow: */kurgan/ #65
  85. Disallow: */cherepovec/ #66
  86. Disallow: */orel/ #67
  87. Disallow: */oryol/
  88. Disallow: */arhangelsk/ #68
  89. Disallow: */vladikavkaz/ #69
  90. Disallow: */nizhnevartovsk/ #70
  91. Disallow: */yoshkar-ola/ #71**********
  92. Disallow: */sterlitamak/ #72
  93. Disallow: */murmansk/ #73
  94. Disallow: */kostroma/ #74
  95. Disallow: */novorossijsk/ #75
  96. Disallow: */tambov/ #76
  97. Disallow: */himki/ #77
  98. Disallow: */mytischi/ #78********
  99. Disallow: */nalchik/ #79********
  100. Disallow: */taganrog/ #80
  101. ## googleonly opt storefronts ##
  102. Disallow: */msk-opt/ #1
  103. Disallow: */moskva-opt/
  104. Disallow: */spb-opt/ #2
  105. Disallow: */novosibirsk-opt/ #3
  106. Disallow: */nsk-opt/
  107. Disallow: */ekb-opt/ #4
  108. Disallow: */ekaterinburg-opt/
  109. Disallow: */eburg-opt/
  110. Disallow: */kazan-opt/ #5
  111. Disallow: */nn-opt/ #6
  112. Disallow: */chelyabinsk-opt/ #7
  113. Disallow: */cheljabinsk-opt/
  114. Disallow: */krasnoyarsk-opt/ #8
  115. Disallow: */krasnojarsk-opt/
  116. Disallow: */samara-opt/ #9
  117. Disallow: */ufa-opt/ #10
  118. Disallow: */rostov-opt/ #11
  119. Disallow: */omsk-opt/ #12
  120. Disallow: */krasnodar-opt/ #13
  121. Disallow: */voronezh-opt/ #14
  122. Disallow: */perm-opt/ #15
  123. Disallow: */volgograd-opt/ #16
  124. Disallow: */saratov-opt/ #17
  125. Disallow: */tyumen-opt/ #18
  126. Disallow: */tjumen-opt/
  127. Disallow: */sochi-opt/ #44
  128. Disallow: */ivanovo-opt/ #51
  129. ## system hidden pages ##
  130. Disallow: *admin/
  131. Disallow: *helpdesk/
  132. Disallow: *yandexmarket/
  133. Disallow: *cml1c/
  134. Disallow: */vk/
  135. Disallow: */xml/
  136. Disallow: */yml/
  137. Disallow: */turbo/
  138. Disallow: */logs/
  139. Disallow: *multiform/
  140. Disallow: *webasyst/
  141. Disallow: */test/
  142. Disallow: */old/
  143. Disallow: *.html
  144. Disallow: *.php
  145. Disallow: *.pdf
  146. Disallow: */amp/
  147. ## info and service pages ##
  148. Disallow: *search
  149. Disallow: *mailer/
  150. Disallow: *login/
  151. Disallow: *signup/
  152. Disallow: *forgotpassword/
  153. Disallow: *order/
  154. Disallow: */cart/
  155. Disallow: *onestep/
  156. Disallow: *checkout/
  157. Disallow: */my/
  158. ## service links ##
  159. Disallow: *tel:
  160. Disallow: *skype:
  161. Disallow: *mailto:
  162. Disallow: *tg:
  163. Disallow: *viber:
  164. ## garbage and dublicates ##
  165. Disallow: *undefined
  166. Disallow: *compare/
  167. Disallow: *?
  168. Allow: *.*?
  169. Allow: *config/?
  170. Allow: *?page=
  171. Disallow: *?page=*&
  172. Disallow: *&page=
  173. Disallow: *?page=1
  174. Allow: *?page=10
  175. Allow: *?page=11
  176. Allow: *?page=12
  177. Allow: *?page=13
  178. Allow: *?page=14
  179. Allow: *?page=15
  180. Allow: *?page=16
  181. Allow: *?page=17
  182. Allow: *?page=18
  183. Allow: *?page=19
  184. Disallow: *?page=10*&
  185. Disallow: *?page=11*&
  186. Disallow: *?page=12*&
  187. Disallow: *?page=13*&
  188. Disallow: *?page=14*&
  189. Disallow: *?page=15*&
  190. Disallow: *?page=16*&
  191. Disallow: *?page=17*&
  192. Disallow: *?page=18*&
  193. Disallow: *?page=19*&
  194. Disallow: *product*/?page=
  195. ## blog garbage ##
  196. Disallow: */author/
  197. Disallow: */2015/
  198. Disallow: */2016/
  199. Disallow: */2017/
  200. Disallow: */2018/
  201. Disallow: */2019/
  202. Disallow: */2020/
  203. Disallow: */2021/
  204. Disallow: */2022/
  205. Disallow: */2023/
  206. Disallow: */2024/
  207. Disallow: */2025/
  208. Disallow: */2026/
  209. Disallow: */2027/
  210. Disallow: */2028/
  211. Disallow: */2029/
  212. Disallow: */2030/
  213. Disallow: */2031/
  214. Disallow: */2032/
  215. Disallow: */2033/
  216. Disallow: */2034/
  217. Disallow: */2035/
  218. Allow: /product/20*/
  219. Disallow: /product/20*/?
  220. ## individual rules ##
  221. Disallow: */tag/
  222. Disallow: */reviews/
  223. ## end ##
  224. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  225. Sitemap: https://site.ru/sitemap.xml
  226. User-agent: Googlebot
  227. ## system hidden pages ##
  228. Disallow: *admin/
  229. Disallow: *helpdesk/
  230. Disallow: *yandexmarket/
  231. Disallow: *cml1c/
  232. Disallow: */vk/
  233. Disallow: */xml/
  234. Disallow: */yml/
  235. Disallow: */turbo/
  236. Disallow: */logs/
  237. Disallow: *multiform/
  238. Disallow: *webasyst/
  239. Disallow: */test/
  240. Disallow: */old/
  241. Disallow: *.html
  242. Disallow: *.php
  243. Disallow: *.pdf
  244. ## info and service pages ##
  245. Disallow: *search
  246. Disallow: *mailer/
  247. Disallow: *login/
  248. Disallow: *signup/
  249. Disallow: *forgotpassword/
  250. Disallow: *order/
  251. Disallow: */cart/
  252. Disallow: *onestep/
  253. Disallow: *checkout/
  254. Disallow: */my/
  255. ## service links ##
  256. Disallow: *tel:
  257. Disallow: *skype:
  258. Disallow: *mailto:
  259. Disallow: *tg:
  260. Disallow: *viber:
  261. ## garbage and dublicates ##
  262. Disallow: *undefined
  263. Disallow: *compare/
  264. Disallow: *?
  265. Allow: *.*?
  266. Allow: *config/?
  267. Allow: *?page=
  268. Disallow: *?page=*&
  269. Disallow: *&page=
  270. Disallow: *?page=1
  271. Allow: *?page=10
  272. Allow: *?page=11
  273. Allow: *?page=12
  274. Allow: *?page=13
  275. Allow: *?page=14
  276. Allow: *?page=15
  277. Allow: *?page=16
  278. Allow: *?page=17
  279. Allow: *?page=18
  280. Allow: *?page=19
  281. Disallow: *?page=10*&
  282. Disallow: *?page=11*&
  283. Disallow: *?page=12*&
  284. Disallow: *?page=13*&
  285. Disallow: *?page=14*&
  286. Disallow: *?page=15*&
  287. Disallow: *?page=16*&
  288. Disallow: *?page=17*&
  289. Disallow: *?page=18*&
  290. Disallow: *?page=19*&
  291. Disallow: *product*/?page=
  292. Allow: *utm_source=
  293. ## blog garbage ##
  294. Disallow: */author/
  295. Disallow: */2015/
  296. Disallow: */2016/
  297. Disallow: */2017/
  298. Disallow: */2018/
  299. Disallow: */2019/
  300. Disallow: */2020/
  301. Disallow: */2021/
  302. Disallow: */2022/
  303. Disallow: */2023/
  304. Disallow: */2024/
  305. Disallow: */2025/
  306. Disallow: */2026/
  307. Disallow: */2027/
  308. Disallow: */2028/
  309. Disallow: */2029/
  310. Disallow: */2030/
  311. Disallow: */2031/
  312. Disallow: */2032/
  313. Disallow: */2033/
  314. Disallow: */2034/
  315. Disallow: */2035/
  316. Allow: /product/20*/
  317. Disallow: /product/20*/?
  318. ## individual rules ##
  319. Disallow: */tag/
  320. Disallow: */reviews/
  321. ## end ##
  322. Sitemap: https://site.ru/sitemap.xml
  323. User-agent: *
  324. ## googleonly usual storefronts ##
  325. Disallow: */msk/ #1
  326. Disallow: */moskva/
  327. Disallow: */spb/ #2
  328. Disallow: */novosibirsk/ #3
  329. Disallow: */nsk/
  330. Disallow: */ekb/ #4
  331. Disallow: */ekaterinburg/
  332. Disallow: */eburg/
  333. Disallow: */kazan/ #5
  334. Disallow: */nn/ #6
  335. Disallow: */chelyabinsk/ #7
  336. Disallow: */cheljabinsk/
  337. Disallow: */krasnoyarsk/ #8
  338. Disallow: */krasnojarsk/
  339. Disallow: */samara/ #9
  340. Disallow: */ufa/ #10
  341. Disallow: */rostov/ #11
  342. Disallow: */omsk/ #12
  343. Disallow: */krasnodar/ #13
  344. Disallow: */voronezh/ #14
  345. Disallow: */perm/ #15
  346. Disallow: */volgograd/ #16
  347. Disallow: */saratov/ #17
  348. Disallow: */tyumen/ #18
  349. Disallow: */tjumen/
  350. Disallow: */tolyatti/ #19
  351. Disallow: */toljatti/
  352. Disallow: */barnaul/ #20
  353. Disallow: */izhevsk/ #21
  354. Disallow: */mahachkala/ #22
  355. Disallow: */izhevsk/ #21**************
  356. Disallow: */habarovsk/ #22
  357. Disallow: */ulyanovsk/ #23
  358. Disallow: */uljanovsk/
  359. Disallow: */irkutsk/ #24**************
  360. Disallow: */vladivostok/ #25
  361. Disallow: */yaroslavl/ #26
  362. Disallow: */jaroslavl/
  363. Disallow: */kemerovo/ #27
  364. Disallow: */tomsk/ #28
  365. Disallow: */naberezhnye-chelny/ #29
  366. Disallow: */sevastopol/ #30
  367. Disallow: */stavropol/ #31
  368. Disallow: */orenburg/ #32
  369. Disallow: */stavropol/ #33
  370. Disallow: */novokuzneck/ #34
  371. Disallow: */ryazan/ #35
  372. Disallow: */rjazan/
  373. Disallow: */balashiha/ #36
  374. Disallow: */penza/ #37
  375. Disallow: */cheboksary/ #38
  376. Disallow: */lipeck/ #39
  377. Disallow: */kaliningrad/ #40
  378. Disallow: */astrahan/ #41
  379. Disallow: */tula/ #42
  380. Disallow: */kirov/ #43
  381. Disallow: */sochi/ #44
  382. Disallow: */kursk/ #45
  383. Disallow: */ulan-udeh/ #46
  384. Disallow: */tver/ #47
  385. Disallow: */magnitogorsk/ #48
  386. Disallow: */surgut/ #49
  387. Disallow: */bryansk/ #50
  388. Disallow: */brjansk/
  389. Disallow: */ivanovo/ #51
  390. Disallow: */yakutsk/ #52
  391. Disallow: */jakutsk/
  392. Disallow: */vladimir/ #53
  393. Disallow: */simferopol/ #54
  394. Disallow: */belgorod/ #55
  395. Disallow: */nizhnij-tagil/ #56
  396. Disallow: */kaluga/ #57
  397. Disallow: */chita/ #58
  398. Disallow: */groznyj/ #59
  399. Disallow: */volzhskij/ #60
  400. Disallow: */smolensk/ #61
  401. Disallow: */podolsk/ #62
  402. Disallow: */saransk/ #63
  403. Disallow: */vologda/ #64
  404. Disallow: */kurgan/ #65
  405. Disallow: */cherepovec/ #66
  406. Disallow: */orel/ #67
  407. Disallow: */oryol/
  408. Disallow: */arhangelsk/ #68
  409. Disallow: */vladikavkaz/ #69
  410. Disallow: */nizhnevartovsk/ #70
  411. Disallow: */yoshkar-ola/ #71**********
  412. Disallow: */sterlitamak/ #72
  413. Disallow: */murmansk/ #73
  414. Disallow: */kostroma/ #74
  415. Disallow: */novorossijsk/ #75
  416. Disallow: */tambov/ #76
  417. Disallow: */himki/ #77
  418. Disallow: */mytischi/ #78********
  419. Disallow: */nalchik/ #79********
  420. Disallow: */taganrog/ #80
  421. ## googleonly opt storefronts ##
  422. Disallow: */msk-opt/ #1
  423. Disallow: */moskva-opt/
  424. Disallow: */spb-opt/ #2
  425. Disallow: */novosibirsk-opt/ #3
  426. Disallow: */nsk-opt/
  427. Disallow: */ekb-opt/ #4
  428. Disallow: */ekaterinburg-opt/
  429. Disallow: */eburg-opt/
  430. Disallow: */kazan-opt/ #5
  431. Disallow: */nn-opt/ #6
  432. Disallow: */chelyabinsk-opt/ #7
  433. Disallow: */cheljabinsk-opt/
  434. Disallow: */krasnoyarsk-opt/ #8
  435. Disallow: */krasnojarsk-opt/
  436. Disallow: */samara-opt/ #9
  437. Disallow: */ufa-opt/ #10
  438. Disallow: */rostov-opt/ #11
  439. Disallow: */omsk-opt/ #12
  440. Disallow: */krasnodar-opt/ #13
  441. Disallow: */voronezh-opt/ #14
  442. Disallow: */perm-opt/ #15
  443. Disallow: */volgograd-opt/ #16
  444. Disallow: */saratov-opt/ #17
  445. Disallow: */tyumen-opt/ #18
  446. Disallow: */tjumen-opt/
  447. Disallow: */sochi-opt/ #44
  448. Disallow: */ivanovo-opt/ #51
  449. ## system hidden pages ##
  450. Disallow: *admin/
  451. Disallow: *helpdesk/
  452. Disallow: *yandexmarket/
  453. Disallow: *cml1c/
  454. Disallow: */vk/
  455. Disallow: */xml/
  456. Disallow: */yml/
  457. Disallow: */turbo/
  458. Disallow: */logs/
  459. Disallow: *multiform/
  460. Disallow: *webasyst/
  461. Disallow: */test/
  462. Disallow: */old/
  463. Disallow: *.html
  464. Disallow: *.php
  465. Disallow: *.pdf
  466. Disallow: */amp/
  467. ## info and service pages ##
  468. Disallow: *search
  469. Disallow: *mailer/
  470. Disallow: *login/
  471. Disallow: *signup/
  472. Disallow: *forgotpassword/
  473. Disallow: *order/
  474. Disallow: */cart/
  475. Disallow: *onestep/
  476. Disallow: *checkout/
  477. Disallow: */my/
  478. ## service links ##
  479. Disallow: *tel:
  480. Disallow: *skype:
  481. Disallow: *mailto:
  482. Disallow: *tg:
  483. Disallow: *viber:
  484. ## garbage and dublicates ##
  485. Disallow: *undefined
  486. Disallow: *compare/
  487. Disallow: *?
  488. Allow: *.*?
  489. Allow: *config/?
  490. Allow: *?page=
  491. Disallow: *?page=*&
  492. Disallow: *&page=
  493. Disallow: *?page=1
  494. Allow: *?page=10
  495. Allow: *?page=11
  496. Allow: *?page=12
  497. Allow: *?page=13
  498. Allow: *?page=14
  499. Allow: *?page=15
  500. Allow: *?page=16
  501. Allow: *?page=17
  502. Allow: *?page=18
  503. Allow: *?page=19
  504. Disallow: *?page=10*&
  505. Disallow: *?page=11*&
  506. Disallow: *?page=12*&
  507. Disallow: *?page=13*&
  508. Disallow: *?page=14*&
  509. Disallow: *?page=15*&
  510. Disallow: *?page=16*&
  511. Disallow: *?page=17*&
  512. Disallow: *?page=18*&
  513. Disallow: *?page=19*&
  514. Disallow: *product*/?page=
  515. ## blog garbage ##
  516. Disallow: */author/
  517. Disallow: */2015/
  518. Disallow: */2016/
  519. Disallow: */2017/
  520. Disallow: */2018/
  521. Disallow: */2019/
  522. Disallow: */2020/
  523. Disallow: */2021/
  524. Disallow: */2022/
  525. Disallow: */2023/
  526. Disallow: */2024/
  527. Disallow: */2025/
  528. Disallow: */2026/
  529. Disallow: */2027/
  530. Disallow: */2028/
  531. Disallow: */2029/
  532. Disallow: */2030/
  533. Disallow: */2031/
  534. Disallow: */2032/
  535. Disallow: */2033/
  536. Disallow: */2034/
  537. Disallow: */2035/
  538. Allow: /product/20*/
  539. Disallow: /product/20*/?
  540. ## individual rules ##
  541. Disallow: */tag/
  542. Disallow: */reviews/
  543. ## end ##
  544. Crawl-delay: 5
  545. Sitemap: https://site.ru/sitemap.xml
  546. User-agent: Mediapartners-Google
  547. Allow: /
  548. Crawl-delay: 3
Инструкция по внедрению robots.txt на региональные поддомены сайта
  1. Скопируйте себе весь код для региональных поддоменов.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: /tag/" и "Disallow: */tag/".
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчку "Disallow: */reviews/".
  4. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##".
  5. Введите итоговый код:
    • Если вы используете плагин "SEO-регионы", то перейдите на страницу "/webasyst/shop/?plugin=regions&action=robots", вставьте код туда, выберите все региональные витрины (т.е. все витрины кроме основной) и нажмите кнопку "Сохранить".
    • Если вы не используете плагин "SEO-регионы", то заходите в настройки сайта и поочередно выбирая все региональные витрины, вставляйте код и сохраняйте изменения, не забывая при этом заменять в строчке "Sitemap: https://{storefront_url}/sitemap.xml" фрагмент "{storefront_url}" на домен вашей региональной витрины (пример: "Sitemap: https://spb.test.ru/sitemap.xml").
  6. Обязательно проверьте файл robots.txt на региональных витринах после внесения изменений (доступны по адресу https://spb.site.ru/robots.txt, https://ufa.site.ru/robots.txt, https://omsk.site.ru/robots.txt, итд).

Шаблон robots.txt для региональных поддоменов

  1. #upd 19.09.2022
  2. #author: @anatoly_chikurov
  3. User-agent: *
  4. Disallow: /
  5. User-agent: Yandex
  6. ## googleonly pages ##
  7. ## content pages ##
  8. Disallow: */blog/
  9. Disallow: */stati/
  10. Disallow: */novosti
  11. Disallow: */seorating/
  12. Disallow: */rating/
  13. ## system hidden pages ##
  14. Disallow: *admin/
  15. Disallow: *helpdesk/
  16. Disallow: *yandexmarket/
  17. Disallow: *cml1c/
  18. Disallow: */vk/
  19. Disallow: */xml/
  20. Disallow: */yml/
  21. Disallow: */turbo/
  22. Disallow: */logs/
  23. Disallow: *multiform/
  24. Disallow: *webasyst/
  25. Disallow: */test/
  26. Disallow: */old/
  27. Disallow: *.html
  28. Disallow: *.php
  29. Disallow: *.pdf
  30. Disallow: */amp/
  31. ## info and service pages ##
  32. Disallow: *search
  33. Disallow: *mailer/
  34. Disallow: *login/
  35. Disallow: *signup/
  36. Disallow: *forgotpassword/
  37. Disallow: *order/
  38. Disallow: */cart/
  39. Disallow: *onestep/
  40. Disallow: *checkout/
  41. Disallow: */my/
  42. ## service links ##
  43. Disallow: *tel:
  44. Disallow: *skype:
  45. Disallow: *mailto:
  46. Disallow: *tg:
  47. Disallow: *viber:
  48. ## garbage and dublicates ##
  49. Disallow: *undefined
  50. Disallow: *compare/
  51. Disallow: *?
  52. Allow: *.*?
  53. Allow: *config/?
  54. Allow: *?page=
  55. Disallow: *?page=*&
  56. Disallow: *&page=
  57. Disallow: *?page=1
  58. Allow: *?page=10
  59. Allow: *?page=11
  60. Allow: *?page=12
  61. Allow: *?page=13
  62. Allow: *?page=14
  63. Allow: *?page=15
  64. Allow: *?page=16
  65. Allow: *?page=17
  66. Allow: *?page=18
  67. Allow: *?page=19
  68. Disallow: *?page=10*&
  69. Disallow: *?page=11*&
  70. Disallow: *?page=12*&
  71. Disallow: *?page=13*&
  72. Disallow: *?page=14*&
  73. Disallow: *?page=15*&
  74. Disallow: *?page=16*&
  75. Disallow: *?page=17*&
  76. Disallow: *?page=18*&
  77. Disallow: *?page=19*&
  78. Disallow: *product*/?page=
  79. ## blog garbage ##
  80. Disallow: */author/
  81. Disallow: */2015/
  82. Disallow: */2016/
  83. Disallow: */2017/
  84. Disallow: */2018/
  85. Disallow: */2019/
  86. Disallow: */2020/
  87. Disallow: */2021/
  88. Disallow: */2022/
  89. Disallow: */2023/
  90. Disallow: */2024/
  91. Disallow: */2025/
  92. Disallow: */2026/
  93. Disallow: */2027/
  94. Disallow: */2028/
  95. Disallow: */2029/
  96. Disallow: */2030/
  97. Disallow: */2031/
  98. Disallow: */2032/
  99. Disallow: */2033/
  100. Disallow: */2034/
  101. Disallow: */2035/
  102. Allow: /product/20*/
  103. Disallow: /product/20*/?
  104. ## individual rules ##
  105. Disallow: */tag/
  106. Disallow: */reviews/
  107. ## end ##
  108. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  109. Sitemap: https://{storefront_url}/sitemap.xml
Написать комментарий
11 комментариев
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова26 декабря 2020 13:32
Обновление #upd 26.12.2020
— снят запрет с индексации .js, .css, и прочих файлов, если они подключены с get-параметрам, содержащими информацию о версии файлов
— снят запрет для индексации страниц товаров c рекламными UTM-метками для Googlebot
— снят запрет для индексации AMP-страниц для Googlebot
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова18 января 2021 06:40
Обновление #upd 18.01.2020
— удаление лишних директив
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова6 февраля 2021 12:17
Обновление 06.02.2020
— новая группа правил ## googleonly pages ## (для проектов, на которых реализовано продвижение папками в Google)
— новая группа правил ## content pages ## (для проектов, на которых имеется блог и/или используется плагин "SEO-топы и списки")
В
ВЕталВеб-студия Анатолия Чикурова28 апреля 2021 23:39
Добрый!
Расскажите по подробней пожалуйста о директиве:

## googleonly pages ##
Disallow: */spb/
Disallow: */spb-opt/
Disallow: */ekb/
Disallow: */ekb-opt/
Disallow: */novosibirsk/

Вы пишите , что "Данный шаблон robots.txt подойдет для 99% интернет-магазинов". Я например на сайтах не использую подобных каталогов, я использую субдомены. Соответственно мне закрывать в роботсе нет смысла региональные каталоги, и исходя из этого мне можно удалить эту часть роботса? или я не правильно понял назначение директивы ## googleonly pages ## ?

И ещё в вашем шаблоне роботса региональные каталоги закрыты (Disallow) и для основного домена и для регионального, в чём фишка?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова29 апреля 2021 11:13
Фишка в том, что папки индексируются только у основного домена и только в гугле.

Если вы не используете папки для продвижения в Google, то закрыв их от индексации вы в общем-то ничего не потеряете. Будет лишь несколько лишних строк в robots.txt, которые ничего не делают. Хотите их удалить - удаляйте.
Д
ДенисВеб-студия Анатолия Чикурова21 июня 2021 17:11
Добрый день.
Надо ли что то менять в файлах robots, предоставленных Вами, если у меня интернет магазин на поддоменах xxx.site.ru ?
В региональном файле Вы закрыли индексацию для всех поисковиков кроме Яндекса. На сколько понял это нужно для сайтов на папках. Нужно ли это делать в моем случае? Для Чего нужен User-agent: Mediapartners-Google на основной витрине?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова22 июня 2021 14:56
Денис, для начала, немного "моей" терминалогии:
- "витрина на поддомене" - это сайт вида msk.site.ru
- "витрина на папке" - это витрина сайта вида site.ru/msk/

Гугл очень неохотно индексирует/ранжирует поддомены. Но папки воспринимает нормально, если все грамотно настроено.

Яндекс, напротив, хорошо воспринимает поддомены. В идеале на сайте нужно реализовывать гибрид поддоменов и папок: поддомены кормить Яндексу, папки кормить Гуглу.

Скорее всего у вас все реализовано на поддоменах, а не на папках (я не встречал ни одного сайта на Webasyst, сделанного не мной, на котором грамотно настроены папки для гугла).

Файл robots.txt, представленный на данной странице, универсален - его можно в неизменном виде внедрять и на проекты на поддоменах, и на проекты на папках, и на проекты с гибридной системой. Если у вас не реализованы папки и вы не удалите правила, которые используются в файле-шаблоне robots.txt, то у вас просто будут лишние строки, которые абсолютно ни на что не влияют.

---

Что касается "User-agent: Mediapartners-Google" - долго объяснять. Если вкратце, это правило было добавлено для снятия запрета на индексацию страниц товаров с GET-параметрами для гугловского робота, который парсит сайт с целью сбора информации для рекламных сервисов (в частности, для сервиса "Google Покупки").

Однако на практике это не всегда работает, поскольку Google сам же перестал следовать своей документации и за информацией на сайт часто приходят обычные "нерекламные" роботы. Подозреваю, что это недоразумение связано с переходом на Mobile First индексацию и в будущем специалисты Google это исправят. Ну а пока что в robots.txt приходится добавлять строчку "Allow: *utm_source=", во избежание проблем работы магазина на сервисе "Google Покупки".

---

В любом случае, рекомендую вам следовать стандартному шаблону. Он проверен на огромном количестве сайтов и действительно является универсальным решением.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова8 августа 2021 09:17
Обновление #upd 08.08.2021
— добавлены новые правила для запрета сканирования некоторых страниц пагинаций
Л
Лаба ИльяВеб-студия Анатолия Чикурова14 декабря 2021 16:37
Анатолий в вашем примере по пагинации вы ориентируетесь на 20 страниц. Вопрос если у меня больше 20 я их все перечисляю ???

Allow: *?page=142
Allow: *?page=143
Allow: *?page=144
и т.д

Disallow: *?page=142*&
Disallow: *?page=143*&
Disallow: *?page=144*&
и т.д

А если у меня в корневую категорию выводятся все подкатегории, то это могут быть и очень больше цифры.

Например в этой категории https://huha.com.ua/category/tovary-dlya-detey/ более 2000 страниц пагинации. Будет ли нормально работать robot.txt если прописать все 2000 страниц пагинации???

Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова15 декабря 2021 06:57
В этом нет необходимости. 10 правил вида Allow: *?page=10, Allow: *?page=11 добавлены, чтобы перебить директиву Disallow: *?page=1 закрывающую страницу-дубль категории. Если у вас в категории есть хоть 2000 страниц пагинаций, их сканирование не будет запрещено. Дополнительных правил для каждой отдельно взятой страницы пагинации прописывать не требуется.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова19 сентября 2022 09:06
Обновление #upd 19.09.2022
— полностью переработан подраздел ## googleonly usual storefronts ##
— добавлен подраздел ## googleonly opt storefronts ##

Если вы не понимаете что это за правила в robots.txt - значит они вам не нужны. Можете их оставить, можете удалить - разницы не будет.