robots.txt: универсальный файл для интернет-магазина на Webasyst Shop Script. Инструкция по внедрению

Ниже представлен шаблонный robots.txt для интернет-магазинов на Webasyst Shop Script. Данный шаблон robots.txt подойдет для 99% интернет-магазинов. Обратите внимание на выделенные в шаблоне строчки красным цветом: их необходимо перед размещением подкоррективать.

Чикуров Анатолий
Для тех кто хочет немного теории - есть отдельная статья на тему "Правильная настройка индексации интернет-магазина на Shop Script". Ссылка на статью.
Инструкция по внедрению robots.txt на основную витрину сайта
  1. Скопируйте себе весь код для основной витрины сайта.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: */tag/" (3 раза).
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчки "Disallow: */reviews/" (3 раза).
  4. В строчке "Sitemap: https://site.ru/sitemap.xml" укажите домен своего сайта вместо "site.ru" (3 раза).
  5. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##" (3 раза).
  6. Убедитесь, что вы внесли изменения 3 раза для каждого User-agent-а: для Yandex, для Google, и для всех остальных роботов (User-agent: *)
  7. Введите итоговый код в настройках («админка» --> «Сайт» --> «*выбрать основную витрину из списка*» --> «Настройки сайта» --> «поле "robots.txt"»
  8. Обязательно проверьте файл robots.txt на основной витрине после внесения изменений (доступен по адресу https://site.ru/robots.txt).

Шаблон robots.txt для основной витрины сайта

  1. #upd 10.08.2023
  2. #author: @anatoly_chikurov
  3. User-agent: Yandex
  4. ## googleonly usual storefronts ##
  5. Disallow: */msk/ #1
  6. Disallow: */moskva/
  7. Disallow: */spb/ #2
  8. Disallow: */novosibirsk/ #3
  9. Disallow: */nsk/
  10. Disallow: */ekb/ #4
  11. Disallow: */ekaterinburg/
  12. Disallow: */eburg/
  13. Disallow: */kazan/ #5
  14. Disallow: */nn/ #6
  15. Disallow: */chelyabinsk/ #7
  16. Disallow: */cheljabinsk/
  17. Disallow: */krasnoyarsk/ #8
  18. Disallow: */krasnojarsk/
  19. Disallow: */samara/ #9
  20. Disallow: */ufa/ #10
  21. Disallow: */rostov/ #11
  22. Disallow: */omsk/ #12
  23. Disallow: */krasnodar/ #13
  24. Disallow: */voronezh/ #14
  25. Disallow: */perm/ #15
  26. Disallow: */volgograd/ #16
  27. Disallow: */saratov/ #17
  28. Disallow: */tyumen/ #18
  29. Disallow: */tjumen/
  30. Disallow: */tolyatti/ #19
  31. Disallow: */toljatti/
  32. Disallow: */barnaul/ #20
  33. Disallow: */izhevsk/ #21
  34. Disallow: */mahachkala/ #22
  35. Disallow: */habarovsk/ #23
  36. Disallow: */ulyanovsk/ #24
  37. Disallow: */uljanovsk/
  38. Disallow: */irkutsk/ #25**************
  39. Disallow: */vladivostok/ #26
  40. Disallow: */yaroslavl/ #27
  41. Disallow: */jaroslavl/
  42. Disallow: */kemerovo/ #28
  43. Disallow: */tomsk/ #29
  44. Disallow: */naberezhnye-chelny/ #30
  45. Disallow: */sevastopol/ #31
  46. Disallow: */stavropol/ #32
  47. Disallow: */orenburg/ #33
  48. Disallow: */stavropol/ #34
  49. Disallow: */novokuzneck/ #35
  50. Disallow: */ryazan/ #36
  51. Disallow: */rjazan/
  52. Disallow: */balashiha/ #37
  53. Disallow: */penza/ #38
  54. Disallow: */cheboksary/ #39
  55. Disallow: */lipeck/ #40
  56. Disallow: */kaliningrad/ #41
  57. Disallow: */astrahan/ #42
  58. Disallow: */tula/ #43
  59. Disallow: */kirov/ #44
  60. Disallow: */sochi/ #45
  61. Disallow: */kursk/ #46
  62. Disallow: */ulan-udeh/ #47
  63. Disallow: */tver/ #48
  64. Disallow: */magnitogorsk/ #49
  65. Disallow: */surgut/ #50
  66. Disallow: */bryansk/ #51
  67. Disallow: */brjansk/
  68. Disallow: */ivanovo/ #52
  69. Disallow: */yakutsk/ #53
  70. Disallow: */jakutsk/
  71. Disallow: */vladimir/ #54
  72. Disallow: */simferopol/ #55
  73. Disallow: */belgorod/ #56
  74. Disallow: */nizhnij-tagil/ #57
  75. Disallow: */kaluga/ #58
  76. Disallow: */chita/ #59
  77. Disallow: */groznyj/ #60
  78. Disallow: */volzhskij/ #61
  79. Disallow: */smolensk/ #62
  80. Disallow: */podolsk/ #63
  81. Disallow: */saransk/ #64
  82. Disallow: */vologda/ #65
  83. Disallow: */kurgan/ #66
  84. Disallow: */cherepovec/ #67
  85. Disallow: */orel/ #68
  86. Disallow: */oryol/
  87. Disallow: */arhangelsk/ #69
  88. Disallow: */vladikavkaz/ #70
  89. Disallow: */nizhnevartovsk/ #71
  90. Disallow: */yoshkar-ola/ #72**********
  91. Disallow: */sterlitamak/ #73
  92. Disallow: */murmansk/ #74
  93. Disallow: */kostroma/ #75
  94. Disallow: */novorossijsk/ #76
  95. Disallow: */tambov/ #77
  96. Disallow: */himki/ #78
  97. Disallow: */mytischi/ #79********
  98. Disallow: */nalchik/ #80********
  99. Disallow: */taganrog/ #81
  100. ## googleonly opt storefronts ##
  101. Disallow: */msk-opt/ #1
  102. Disallow: */moskva-opt/
  103. Disallow: */spb-opt/ #2
  104. Disallow: */novosibirsk-opt/ #3
  105. Disallow: */nsk-opt/
  106. Disallow: */ekb-opt/ #4
  107. Disallow: */ekaterinburg-opt/
  108. Disallow: */eburg-opt/
  109. Disallow: */kazan-opt/ #5
  110. Disallow: */nn-opt/ #6
  111. Disallow: */chelyabinsk-opt/ #7
  112. Disallow: */cheljabinsk-opt/
  113. Disallow: */krasnoyarsk-opt/ #8
  114. Disallow: */krasnojarsk-opt/
  115. Disallow: */samara-opt/ #9
  116. Disallow: */ufa-opt/ #10
  117. Disallow: */rostov-opt/ #11
  118. Disallow: */omsk-opt/ #12
  119. Disallow: */krasnodar-opt/ #13
  120. Disallow: */voronezh-opt/ #14
  121. Disallow: */perm-opt/ #15
  122. Disallow: */volgograd-opt/ #16
  123. Disallow: */saratov-opt/ #17
  124. Disallow: */tyumen-opt/ #18
  125. Disallow: */tjumen-opt/
  126. Disallow: */sochi-opt/ #44
  127. Disallow: */ivanovo-opt/ #51
  128. ## system hidden pages ##
  129. Disallow: *admin/
  130. Disallow: *helpdesk/
  131. Disallow: *cml1c/
  132. Disallow: */vk/
  133. Disallow: */turbo/
  134. Disallow: */logs/
  135. Disallow: *multiform/
  136. Disallow: *webasyst/
  137. Disallow: */test/
  138. Disallow: */old/
  139. Disallow: *.html
  140. Disallow: *.php
  141. Disallow: *.pdf
  142. Disallow: */amp/
  143. ## info and service pages ##
  144. Disallow: *search
  145. Disallow: *mailer/
  146. Disallow: *login/
  147. Disallow: *signup/
  148. Disallow: *forgotpassword/
  149. Disallow: *order/
  150. Disallow: */cart/
  151. Disallow: *onestep/
  152. Disallow: *checkout/
  153. Disallow: */my/
  154. ## service links ##
  155. Disallow: *tel:
  156. Disallow: *skype:
  157. Disallow: *mailto:
  158. Disallow: *tg:
  159. Disallow: *viber:
  160. ## garbage and dublicates ##
  161. Disallow: *undefined
  162. Disallow: *compare/
  163. Disallow: *?
  164. Allow: *.*?
  165. Allow: *config/?
  166. Allow: *?page=
  167. Disallow: *?page=*&
  168. Disallow: *&page=
  169. Disallow: *?page=1
  170. Allow: *?page=10
  171. Allow: *?page=11
  172. Allow: *?page=12
  173. Allow: *?page=13
  174. Allow: *?page=14
  175. Allow: *?page=15
  176. Allow: *?page=16
  177. Allow: *?page=17
  178. Allow: *?page=18
  179. Allow: *?page=19
  180. Disallow: *?page=10*&
  181. Disallow: *?page=11*&
  182. Disallow: *?page=12*&
  183. Disallow: *?page=13*&
  184. Disallow: *?page=14*&
  185. Disallow: *?page=15*&
  186. Disallow: *?page=16*&
  187. Disallow: *?page=17*&
  188. Disallow: *?page=18*&
  189. Disallow: *?page=19*&
  190. Disallow: *product*/?page=
  191. ## blog garbage ##
  192. Disallow: */author/
  193. Disallow: */2015/
  194. Disallow: */2016/
  195. Disallow: */2017/
  196. Disallow: */2018/
  197. Disallow: */2019/
  198. Disallow: */2020/
  199. Disallow: */2021/
  200. Disallow: */2022/
  201. Disallow: */2023/
  202. Disallow: */2024/
  203. Disallow: */2025/
  204. Disallow: */2026/
  205. Disallow: */2027/
  206. Disallow: */2028/
  207. Disallow: */2029/
  208. Disallow: */2030/
  209. Disallow: */2031/
  210. Disallow: */2032/
  211. Disallow: */2033/
  212. Disallow: */2034/
  213. Disallow: */2035/
  214. Allow: /product/20*/
  215. Disallow: /product/20*/?
  216. ## individual rules ##
  217. Disallow: */tag/
  218. Disallow: */reviews/
  219. ## end ##
  220. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  221. Sitemap: https://site.ru/sitemap.xml
  222. User-agent: Googlebot
  223. ## system hidden pages ##
  224. Disallow: *admin/
  225. Disallow: *helpdesk/
  226. Disallow: *cml1c/
  227. Disallow: */vk/
  228. Disallow: */turbo/
  229. Disallow: */logs/
  230. Disallow: *multiform/
  231. Disallow: *webasyst/
  232. Disallow: */test/
  233. Disallow: */old/
  234. Disallow: *.html
  235. Disallow: *.php
  236. Disallow: *.pdf
  237. ## info and service pages ##
  238. Disallow: *search
  239. Disallow: *mailer/
  240. Disallow: *login/
  241. Disallow: *signup/
  242. Disallow: *forgotpassword/
  243. Disallow: *order/
  244. Disallow: */cart/
  245. Disallow: *onestep/
  246. Disallow: *checkout/
  247. Disallow: */my/
  248. ## service links ##
  249. Disallow: *tel:
  250. Disallow: *skype:
  251. Disallow: *mailto:
  252. Disallow: *tg:
  253. Disallow: *viber:
  254. ## garbage and dublicates ##
  255. Disallow: *undefined
  256. Disallow: *compare/
  257. Disallow: *?
  258. Allow: *.*?
  259. Allow: *config/?
  260. Allow: *?page=
  261. Disallow: *?page=*&
  262. Disallow: *&page=
  263. Disallow: *?page=1
  264. Allow: *?page=10
  265. Allow: *?page=11
  266. Allow: *?page=12
  267. Allow: *?page=13
  268. Allow: *?page=14
  269. Allow: *?page=15
  270. Allow: *?page=16
  271. Allow: *?page=17
  272. Allow: *?page=18
  273. Allow: *?page=19
  274. Disallow: *?page=10*&
  275. Disallow: *?page=11*&
  276. Disallow: *?page=12*&
  277. Disallow: *?page=13*&
  278. Disallow: *?page=14*&
  279. Disallow: *?page=15*&
  280. Disallow: *?page=16*&
  281. Disallow: *?page=17*&
  282. Disallow: *?page=18*&
  283. Disallow: *?page=19*&
  284. Disallow: *product*/?page=
  285. Allow: *utm_source=
  286. ## blog garbage ##
  287. Disallow: */author/
  288. Disallow: */2015/
  289. Disallow: */2016/
  290. Disallow: */2017/
  291. Disallow: */2018/
  292. Disallow: */2019/
  293. Disallow: */2020/
  294. Disallow: */2021/
  295. Disallow: */2022/
  296. Disallow: */2023/
  297. Disallow: */2024/
  298. Disallow: */2025/
  299. Disallow: */2026/
  300. Disallow: */2027/
  301. Disallow: */2028/
  302. Disallow: */2029/
  303. Disallow: */2030/
  304. Disallow: */2031/
  305. Disallow: */2032/
  306. Disallow: */2033/
  307. Disallow: */2034/
  308. Disallow: */2035/
  309. Allow: /product/20*/
  310. Disallow: /product/20*/?
  311. ## individual rules ##
  312. Disallow: */tag/
  313. Disallow: */reviews/
  314. ## end ##
  315. Sitemap: https://site.ru/sitemap.xml
  316. User-agent: *
  317. ## googleonly usual storefronts ##
  318. Disallow: */msk/ #1
  319. Disallow: */moskva/
  320. Disallow: */spb/ #2
  321. Disallow: */novosibirsk/ #3
  322. Disallow: */nsk/
  323. Disallow: */ekb/ #4
  324. Disallow: */ekaterinburg/
  325. Disallow: */eburg/
  326. Disallow: */kazan/ #5
  327. Disallow: */nn/ #6
  328. Disallow: */chelyabinsk/ #7
  329. Disallow: */cheljabinsk/
  330. Disallow: */krasnoyarsk/ #8
  331. Disallow: */krasnojarsk/
  332. Disallow: */samara/ #9
  333. Disallow: */ufa/ #10
  334. Disallow: */rostov/ #11
  335. Disallow: */omsk/ #12
  336. Disallow: */krasnodar/ #13
  337. Disallow: */voronezh/ #14
  338. Disallow: */perm/ #15
  339. Disallow: */volgograd/ #16
  340. Disallow: */saratov/ #17
  341. Disallow: */tyumen/ #18
  342. Disallow: */tjumen/
  343. Disallow: */tolyatti/ #19
  344. Disallow: */toljatti/
  345. Disallow: */barnaul/ #20
  346. Disallow: */izhevsk/ #21
  347. Disallow: */mahachkala/ #22
  348. Disallow: */habarovsk/ #23
  349. Disallow: */ulyanovsk/ #24
  350. Disallow: */uljanovsk/
  351. Disallow: */irkutsk/ #25**************
  352. Disallow: */vladivostok/ #26
  353. Disallow: */yaroslavl/ #27
  354. Disallow: */jaroslavl/
  355. Disallow: */kemerovo/ #28
  356. Disallow: */tomsk/ #29
  357. Disallow: */naberezhnye-chelny/ #30
  358. Disallow: */sevastopol/ #31
  359. Disallow: */stavropol/ #32
  360. Disallow: */orenburg/ #33
  361. Disallow: */stavropol/ #34
  362. Disallow: */novokuzneck/ #35
  363. Disallow: */ryazan/ #36
  364. Disallow: */rjazan/
  365. Disallow: */balashiha/ #37
  366. Disallow: */penza/ #38
  367. Disallow: */cheboksary/ #39
  368. Disallow: */lipeck/ #40
  369. Disallow: */kaliningrad/ #41
  370. Disallow: */astrahan/ #42
  371. Disallow: */tula/ #43
  372. Disallow: */kirov/ #44
  373. Disallow: */sochi/ #45
  374. Disallow: */kursk/ #46
  375. Disallow: */ulan-udeh/ #47
  376. Disallow: */tver/ #48
  377. Disallow: */magnitogorsk/ #49
  378. Disallow: */surgut/ #50
  379. Disallow: */bryansk/ #51
  380. Disallow: */brjansk/
  381. Disallow: */ivanovo/ #52
  382. Disallow: */yakutsk/ #53
  383. Disallow: */jakutsk/
  384. Disallow: */vladimir/ #54
  385. Disallow: */simferopol/ #55
  386. Disallow: */belgorod/ #56
  387. Disallow: */nizhnij-tagil/ #57
  388. Disallow: */kaluga/ #58
  389. Disallow: */chita/ #59
  390. Disallow: */groznyj/ #60
  391. Disallow: */volzhskij/ #61
  392. Disallow: */smolensk/ #62
  393. Disallow: */podolsk/ #63
  394. Disallow: */saransk/ #64
  395. Disallow: */vologda/ #65
  396. Disallow: */kurgan/ #66
  397. Disallow: */cherepovec/ #67
  398. Disallow: */orel/ #68
  399. Disallow: */oryol/
  400. Disallow: */arhangelsk/ #69
  401. Disallow: */vladikavkaz/ #70
  402. Disallow: */nizhnevartovsk/ #71
  403. Disallow: */yoshkar-ola/ #72**********
  404. Disallow: */sterlitamak/ #73
  405. Disallow: */murmansk/ #74
  406. Disallow: */kostroma/ #75
  407. Disallow: */novorossijsk/ #76
  408. Disallow: */tambov/ #77
  409. Disallow: */himki/ #78
  410. Disallow: */mytischi/ #79********
  411. Disallow: */nalchik/ #80********
  412. Disallow: */taganrog/ #81
  413. ## googleonly opt storefronts ##
  414. Disallow: */msk-opt/ #1
  415. Disallow: */moskva-opt/
  416. Disallow: */spb-opt/ #2
  417. Disallow: */novosibirsk-opt/ #3
  418. Disallow: */nsk-opt/
  419. Disallow: */ekb-opt/ #4
  420. Disallow: */ekaterinburg-opt/
  421. Disallow: */eburg-opt/
  422. Disallow: */kazan-opt/ #5
  423. Disallow: */nn-opt/ #6
  424. Disallow: */chelyabinsk-opt/ #7
  425. Disallow: */cheljabinsk-opt/
  426. Disallow: */krasnoyarsk-opt/ #8
  427. Disallow: */krasnojarsk-opt/
  428. Disallow: */samara-opt/ #9
  429. Disallow: */ufa-opt/ #10
  430. Disallow: */rostov-opt/ #11
  431. Disallow: */omsk-opt/ #12
  432. Disallow: */krasnodar-opt/ #13
  433. Disallow: */voronezh-opt/ #14
  434. Disallow: */perm-opt/ #15
  435. Disallow: */volgograd-opt/ #16
  436. Disallow: */saratov-opt/ #17
  437. Disallow: */tyumen-opt/ #18
  438. Disallow: */tjumen-opt/
  439. Disallow: */sochi-opt/ #44
  440. Disallow: */ivanovo-opt/ #51
  441. ## system hidden pages ##
  442. Disallow: *admin/
  443. Disallow: *helpdesk/
  444. Disallow: *cml1c/
  445. Disallow: */vk/
  446. Disallow: */turbo/
  447. Disallow: */logs/
  448. Disallow: *multiform/
  449. Disallow: *webasyst/
  450. Disallow: */test/
  451. Disallow: */old/
  452. Disallow: *.html
  453. Disallow: *.php
  454. Disallow: *.pdf
  455. Disallow: */amp/
  456. ## info and service pages ##
  457. Disallow: *search
  458. Disallow: *mailer/
  459. Disallow: *login/
  460. Disallow: *signup/
  461. Disallow: *forgotpassword/
  462. Disallow: *order/
  463. Disallow: */cart/
  464. Disallow: *onestep/
  465. Disallow: *checkout/
  466. Disallow: */my/
  467. ## service links ##
  468. Disallow: *tel:
  469. Disallow: *skype:
  470. Disallow: *mailto:
  471. Disallow: *tg:
  472. Disallow: *viber:
  473. ## garbage and dublicates ##
  474. Disallow: *undefined
  475. Disallow: *compare/
  476. Disallow: *?
  477. Allow: *.*?
  478. Allow: *config/?
  479. Allow: *?page=
  480. Disallow: *?page=*&
  481. Disallow: *&page=
  482. Disallow: *?page=1
  483. Allow: *?page=10
  484. Allow: *?page=11
  485. Allow: *?page=12
  486. Allow: *?page=13
  487. Allow: *?page=14
  488. Allow: *?page=15
  489. Allow: *?page=16
  490. Allow: *?page=17
  491. Allow: *?page=18
  492. Allow: *?page=19
  493. Disallow: *?page=10*&
  494. Disallow: *?page=11*&
  495. Disallow: *?page=12*&
  496. Disallow: *?page=13*&
  497. Disallow: *?page=14*&
  498. Disallow: *?page=15*&
  499. Disallow: *?page=16*&
  500. Disallow: *?page=17*&
  501. Disallow: *?page=18*&
  502. Disallow: *?page=19*&
  503. Disallow: *product*/?page=
  504. ## blog garbage ##
  505. Disallow: */author/
  506. Disallow: */2015/
  507. Disallow: */2016/
  508. Disallow: */2017/
  509. Disallow: */2018/
  510. Disallow: */2019/
  511. Disallow: */2020/
  512. Disallow: */2021/
  513. Disallow: */2022/
  514. Disallow: */2023/
  515. Disallow: */2024/
  516. Disallow: */2025/
  517. Disallow: */2026/
  518. Disallow: */2027/
  519. Disallow: */2028/
  520. Disallow: */2029/
  521. Disallow: */2030/
  522. Disallow: */2031/
  523. Disallow: */2032/
  524. Disallow: */2033/
  525. Disallow: */2034/
  526. Disallow: */2035/
  527. Allow: /product/20*/
  528. Disallow: /product/20*/?
  529. ## individual rules ##
  530. Disallow: */tag/
  531. Disallow: */reviews/
  532. ## end ##
  533. Crawl-delay: 5
  534. Sitemap: https://site.ru/sitemap.xml
  535. User-agent: Mediapartners-Google
  536. Allow: /
  537. Crawl-delay: 3
Инструкция по внедрению robots.txt на региональные поддомены сайта
  1. Скопируйте себе весь код для региональных поддоменов.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: /tag/" и "Disallow: */tag/".
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчку "Disallow: */reviews/".
  4. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##".
  5. Введите итоговый код:
    • Если вы используете плагин "SEO-регионы", то перейдите на страницу "/webasyst/shop/?plugin=regions&action=robots", вставьте код туда, выберите все региональные витрины (т.е. все витрины кроме основной) и нажмите кнопку "Сохранить".
    • Если вы не используете плагин "SEO-регионы", то заходите в настройки сайта и поочередно выбирая все региональные витрины, вставляйте код и сохраняйте изменения, не забывая при этом заменять в строчке "Sitemap: https://{storefront_url}/sitemap.xml" фрагмент "{storefront_url}" на домен вашей региональной витрины (пример: "Sitemap: https://spb.test.ru/sitemap.xml").
  6. Обязательно проверьте файл robots.txt на региональных витринах после внесения изменений (доступны по адресу https://spb.site.ru/robots.txt, https://ufa.site.ru/robots.txt, https://omsk.site.ru/robots.txt, итд).

Шаблон robots.txt для региональных поддоменов

  1. #upd 10.08.2023
  2. #author: @anatoly_chikurov
  3. User-agent: *
  4. Disallow: /
  5. User-agent: Yandex
  6. ## googleonly pages ##
  7. ## content pages ##
  8. Disallow: */blog/
  9. Disallow: */stati/
  10. Disallow: */novosti
  11. Disallow: */seorating/
  12. Disallow: */rating/
  13. ## system hidden pages ##
  14. Disallow: *admin/
  15. Disallow: *helpdesk/
  16. Disallow: *cml1c/
  17. Disallow: */vk/
  18. Disallow: */turbo/
  19. Disallow: */logs/
  20. Disallow: *multiform/
  21. Disallow: *webasyst/
  22. Disallow: */test/
  23. Disallow: */old/
  24. Disallow: *.html
  25. Disallow: *.php
  26. Disallow: *.pdf
  27. Disallow: */amp/
  28. ## info and service pages ##
  29. Disallow: *search
  30. Disallow: *mailer/
  31. Disallow: *login/
  32. Disallow: *signup/
  33. Disallow: *forgotpassword/
  34. Disallow: *order/
  35. Disallow: */cart/
  36. Disallow: *onestep/
  37. Disallow: *checkout/
  38. Disallow: */my/
  39. ## service links ##
  40. Disallow: *tel:
  41. Disallow: *skype:
  42. Disallow: *mailto:
  43. Disallow: *tg:
  44. Disallow: *viber:
  45. ## garbage and dublicates ##
  46. Disallow: *undefined
  47. Disallow: *compare/
  48. Disallow: *?
  49. Allow: *.*?
  50. Allow: *config/?
  51. Allow: *?page=
  52. Disallow: *?page=*&
  53. Disallow: *&page=
  54. Disallow: *?page=1
  55. Allow: *?page=10
  56. Allow: *?page=11
  57. Allow: *?page=12
  58. Allow: *?page=13
  59. Allow: *?page=14
  60. Allow: *?page=15
  61. Allow: *?page=16
  62. Allow: *?page=17
  63. Allow: *?page=18
  64. Allow: *?page=19
  65. Disallow: *?page=10*&
  66. Disallow: *?page=11*&
  67. Disallow: *?page=12*&
  68. Disallow: *?page=13*&
  69. Disallow: *?page=14*&
  70. Disallow: *?page=15*&
  71. Disallow: *?page=16*&
  72. Disallow: *?page=17*&
  73. Disallow: *?page=18*&
  74. Disallow: *?page=19*&
  75. Disallow: *product*/?page=
  76. ## blog garbage ##
  77. Disallow: */author/
  78. Disallow: */2015/
  79. Disallow: */2016/
  80. Disallow: */2017/
  81. Disallow: */2018/
  82. Disallow: */2019/
  83. Disallow: */2020/
  84. Disallow: */2021/
  85. Disallow: */2022/
  86. Disallow: */2023/
  87. Disallow: */2024/
  88. Disallow: */2025/
  89. Disallow: */2026/
  90. Disallow: */2027/
  91. Disallow: */2028/
  92. Disallow: */2029/
  93. Disallow: */2030/
  94. Disallow: */2031/
  95. Disallow: */2032/
  96. Disallow: */2033/
  97. Disallow: */2034/
  98. Disallow: */2035/
  99. Allow: /product/20*/
  100. Disallow: /product/20*/?
  101. ## individual rules ##
  102. Disallow: */tag/
  103. Disallow: */reviews/
  104. ## end ##
  105. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  106. Sitemap: https://{storefront_url}/sitemap.xml
Написать комментарий
15 комментариев
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова26 декабря 2020 13:32
Обновление #upd 26.12.2020
— снят запрет с индексации .js, .css, и прочих файлов, если они подключены с get-параметрам, содержащими информацию о версии файлов
— снят запрет для индексации страниц товаров c рекламными UTM-метками для Googlebot
— снят запрет для индексации AMP-страниц для Googlebot
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова18 января 2021 06:40
Обновление #upd 18.01.2020
— удаление лишних директив
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова6 февраля 2021 12:17
Обновление 06.02.2020
— новая группа правил ## googleonly pages ## (для проектов, на которых реализовано продвижение папками в Google)
— новая группа правил ## content pages ## (для проектов, на которых имеется блог и/или используется плагин "SEO-топы и списки")
В
ВЕталВеб-студия Анатолия Чикурова28 апреля 2021 23:39
Добрый!
Расскажите по подробней пожалуйста о директиве:

## googleonly pages ##
Disallow: */spb/
Disallow: */spb-opt/
Disallow: */ekb/
Disallow: */ekb-opt/
Disallow: */novosibirsk/

Вы пишите , что "Данный шаблон robots.txt подойдет для 99% интернет-магазинов". Я например на сайтах не использую подобных каталогов, я использую субдомены. Соответственно мне закрывать в роботсе нет смысла региональные каталоги, и исходя из этого мне можно удалить эту часть роботса? или я не правильно понял назначение директивы ## googleonly pages ## ?

И ещё в вашем шаблоне роботса региональные каталоги закрыты (Disallow) и для основного домена и для регионального, в чём фишка?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова29 апреля 2021 11:13
Фишка в том, что папки индексируются только у основного домена и только в гугле.

Если вы не используете папки для продвижения в Google, то закрыв их от индексации вы в общем-то ничего не потеряете. Будет лишь несколько лишних строк в robots.txt, которые ничего не делают. Хотите их удалить - удаляйте.
Д
ДенисВеб-студия Анатолия Чикурова21 июня 2021 17:11
Добрый день.
Надо ли что то менять в файлах robots, предоставленных Вами, если у меня интернет магазин на поддоменах xxx.site.ru ?
В региональном файле Вы закрыли индексацию для всех поисковиков кроме Яндекса. На сколько понял это нужно для сайтов на папках. Нужно ли это делать в моем случае? Для Чего нужен User-agent: Mediapartners-Google на основной витрине?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова22 июня 2021 14:56
Денис, для начала, немного "моей" терминалогии:
- "витрина на поддомене" - это сайт вида msk.site.ru
- "витрина на папке" - это витрина сайта вида site.ru/msk/

Гугл очень неохотно индексирует/ранжирует поддомены. Но папки воспринимает нормально, если все грамотно настроено.

Яндекс, напротив, хорошо воспринимает поддомены. В идеале на сайте нужно реализовывать гибрид поддоменов и папок: поддомены кормить Яндексу, папки кормить Гуглу.

Скорее всего у вас все реализовано на поддоменах, а не на папках (я не встречал ни одного сайта на Webasyst, сделанного не мной, на котором грамотно настроены папки для гугла).

Файл robots.txt, представленный на данной странице, универсален - его можно в неизменном виде внедрять и на проекты на поддоменах, и на проекты на папках, и на проекты с гибридной системой. Если у вас не реализованы папки и вы не удалите правила, которые используются в файле-шаблоне robots.txt, то у вас просто будут лишние строки, которые абсолютно ни на что не влияют.

---

Что касается "User-agent: Mediapartners-Google" - долго объяснять. Если вкратце, это правило было добавлено для снятия запрета на индексацию страниц товаров с GET-параметрами для гугловского робота, который парсит сайт с целью сбора информации для рекламных сервисов (в частности, для сервиса "Google Покупки").

Однако на практике это не всегда работает, поскольку Google сам же перестал следовать своей документации и за информацией на сайт часто приходят обычные "нерекламные" роботы. Подозреваю, что это недоразумение связано с переходом на Mobile First индексацию и в будущем специалисты Google это исправят. Ну а пока что в robots.txt приходится добавлять строчку "Allow: *utm_source=", во избежание проблем работы магазина на сервисе "Google Покупки".

---

В любом случае, рекомендую вам следовать стандартному шаблону. Он проверен на огромном количестве сайтов и действительно является универсальным решением.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова8 августа 2021 09:17
Обновление #upd 08.08.2021
— добавлены новые правила для запрета сканирования некоторых страниц пагинаций
Л
Лаба ИльяВеб-студия Анатолия Чикурова14 декабря 2021 16:37
Анатолий в вашем примере по пагинации вы ориентируетесь на 20 страниц. Вопрос если у меня больше 20 я их все перечисляю ???

Allow: *?page=142
Allow: *?page=143
Allow: *?page=144
и т.д

Disallow: *?page=142*&
Disallow: *?page=143*&
Disallow: *?page=144*&
и т.д

А если у меня в корневую категорию выводятся все подкатегории, то это могут быть и очень больше цифры.

Например в этой категории https://huha.com.ua/category/tovary-dlya-detey/ более 2000 страниц пагинации. Будет ли нормально работать robot.txt если прописать все 2000 страниц пагинации???

Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова15 декабря 2021 06:57
В этом нет необходимости. 10 правил вида Allow: *?page=10, Allow: *?page=11 добавлены, чтобы перебить директиву Disallow: *?page=1 закрывающую страницу-дубль категории. Если у вас в категории есть хоть 2000 страниц пагинаций, их сканирование не будет запрещено. Дополнительных правил для каждой отдельно взятой страницы пагинации прописывать не требуется.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова19 сентября 2022 09:06
Обновление #upd 19.09.2022
— полностью переработан подраздел ## googleonly usual storefronts ##
— добавлен подраздел ## googleonly opt storefronts ##

Если вы не понимаете что это за правила в robots.txt - значит они вам не нужны. Можете их оставить, можете удалить - разницы не будет.
Б
Богомолова Ольга ИгоревнаВеб-студия Анатолия Чикурова7 июня 2023 12:28
Ваша настройка robots ведет к тому, что Google не может сканировать даже главную страницу. https://disk.yandex.ru/i/2iW8K2yzqD8Jcw
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова7 июня 2023 14:03
Ольга, всё корректно работает на сотнях проектах.

Не могу посмотреть robots.txt на вашем сайте baf-agro.ru, т.к. вы его на момент написания данного комментария изменили, но скорее всего вы сами допустили грубую ошибку: разместили robots.txt который предназначен для поддомена сайта на основной домен сайта.

В шаблоне robots.txt для поддоменов сайта есть правило запрещающая роботам Google сканировать страницы сайта. Будьте пожалуйста внимательнее.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова8 июля 2023 14:28
Обновление #upd 08.08.2023
— снят запрет для сканирования страниц /yml/
— снят запрет для сканирования страниц /xml/
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова10 августа 2023 15:57
Обновление #upd 10.08.2023
— убран запрет на сканирование страниц содержащих в URL "yandexmarket/"