robots.txt: универсальный файл для интернет-магазина на Webasyst Shop Script. Инструкция по внедрению

Ниже представлен шаблонный robots.txt для интернет-магазинов на Webasyst Shop Script. Данный шаблон robots.txt подойдет для 99% интернет-магазинов. Обратите внимание на выделенные в шаблоне строчки красным цветом: их необходимо перед размещением подкоррективать.

Чикуров Анатолий
Для тех кто хочет немного теории - есть отдельная статья на тему "Правильная настройка индексации интернет-магазина на Shop Script". Ссылка на статью.
Инструкция по внедрению robots.txt на основную витрину сайта
  1. Скопируйте себе весь код для основной витрины сайта.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: */tag/" (3 раза).
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчки "Disallow: */reviews/" (3 раза).
  4. В строчке "Sitemap: https://site.ru/sitemap.xml" укажите домен своего сайта вместо "site.ru" (3 раза).
  5. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##" (3 раза).
  6. Убедитесь, что вы внесли изменения 3 раза для каждого User-agent-а: для Yandex, для Google, и для всех остальных роботов (User-agent: *)
  7. Введите итоговый код в настройках («админка» --> «Сайт» --> «*выбрать основную витрину из списка*» --> «Настройки сайта» --> «поле "robots.txt"»
  8. Обязательно проверьте файл robots.txt на основной витрине после внесения изменений (доступен по адресу https://site.ru/robots.txt).

Шаблон robots.txt для основной витрины сайта

  1. #upd 19.09.2022
  2. #author: @anatoly_chikurov
  3. User-agent: Yandex
  4. ## googleonly usual storefronts ##
  5. Disallow: */msk/ #1
  6. Disallow: */moskva/
  7. Disallow: */spb/ #2
  8. Disallow: */novosibirsk/ #3
  9. Disallow: */nsk/
  10. Disallow: */ekb/ #4
  11. Disallow: */ekaterinburg/
  12. Disallow: */eburg/
  13. Disallow: */kazan/ #5
  14. Disallow: */nn/ #6
  15. Disallow: */chelyabinsk/ #7
  16. Disallow: */cheljabinsk/
  17. Disallow: */krasnoyarsk/ #8
  18. Disallow: */krasnojarsk/
  19. Disallow: */samara/ #9
  20. Disallow: */ufa/ #10
  21. Disallow: */rostov/ #11
  22. Disallow: */omsk/ #12
  23. Disallow: */krasnodar/ #13
  24. Disallow: */voronezh/ #14
  25. Disallow: */perm/ #15
  26. Disallow: */volgograd/ #16
  27. Disallow: */saratov/ #17
  28. Disallow: */tyumen/ #18
  29. Disallow: */tjumen/
  30. Disallow: */tolyatti/ #19
  31. Disallow: */toljatti/
  32. Disallow: */barnaul/ #20
  33. Disallow: */izhevsk/ #21
  34. Disallow: */mahachkala/ #22
  35. Disallow: */habarovsk/ #23
  36. Disallow: */ulyanovsk/ #24
  37. Disallow: */uljanovsk/
  38. Disallow: */irkutsk/ #25**************
  39. Disallow: */vladivostok/ #26
  40. Disallow: */yaroslavl/ #27
  41. Disallow: */jaroslavl/
  42. Disallow: */kemerovo/ #28
  43. Disallow: */tomsk/ #29
  44. Disallow: */naberezhnye-chelny/ #30
  45. Disallow: */sevastopol/ #31
  46. Disallow: */stavropol/ #32
  47. Disallow: */orenburg/ #33
  48. Disallow: */stavropol/ #34
  49. Disallow: */novokuzneck/ #35
  50. Disallow: */ryazan/ #36
  51. Disallow: */rjazan/
  52. Disallow: */balashiha/ #37
  53. Disallow: */penza/ #38
  54. Disallow: */cheboksary/ #39
  55. Disallow: */lipeck/ #40
  56. Disallow: */kaliningrad/ #41
  57. Disallow: */astrahan/ #42
  58. Disallow: */tula/ #43
  59. Disallow: */kirov/ #44
  60. Disallow: */sochi/ #45
  61. Disallow: */kursk/ #46
  62. Disallow: */ulan-udeh/ #47
  63. Disallow: */tver/ #48
  64. Disallow: */magnitogorsk/ #49
  65. Disallow: */surgut/ #50
  66. Disallow: */bryansk/ #51
  67. Disallow: */brjansk/
  68. Disallow: */ivanovo/ #52
  69. Disallow: */yakutsk/ #53
  70. Disallow: */jakutsk/
  71. Disallow: */vladimir/ #54
  72. Disallow: */simferopol/ #55
  73. Disallow: */belgorod/ #56
  74. Disallow: */nizhnij-tagil/ #57
  75. Disallow: */kaluga/ #58
  76. Disallow: */chita/ #59
  77. Disallow: */groznyj/ #60
  78. Disallow: */volzhskij/ #61
  79. Disallow: */smolensk/ #62
  80. Disallow: */podolsk/ #63
  81. Disallow: */saransk/ #64
  82. Disallow: */vologda/ #65
  83. Disallow: */kurgan/ #66
  84. Disallow: */cherepovec/ #67
  85. Disallow: */orel/ #68
  86. Disallow: */oryol/
  87. Disallow: */arhangelsk/ #69
  88. Disallow: */vladikavkaz/ #70
  89. Disallow: */nizhnevartovsk/ #71
  90. Disallow: */yoshkar-ola/ #72**********
  91. Disallow: */sterlitamak/ #73
  92. Disallow: */murmansk/ #74
  93. Disallow: */kostroma/ #75
  94. Disallow: */novorossijsk/ #76
  95. Disallow: */tambov/ #77
  96. Disallow: */himki/ #78
  97. Disallow: */mytischi/ #79********
  98. Disallow: */nalchik/ #80********
  99. Disallow: */taganrog/ #81
  100. ## googleonly opt storefronts ##
  101. Disallow: */msk-opt/ #1
  102. Disallow: */moskva-opt/
  103. Disallow: */spb-opt/ #2
  104. Disallow: */novosibirsk-opt/ #3
  105. Disallow: */nsk-opt/
  106. Disallow: */ekb-opt/ #4
  107. Disallow: */ekaterinburg-opt/
  108. Disallow: */eburg-opt/
  109. Disallow: */kazan-opt/ #5
  110. Disallow: */nn-opt/ #6
  111. Disallow: */chelyabinsk-opt/ #7
  112. Disallow: */cheljabinsk-opt/
  113. Disallow: */krasnoyarsk-opt/ #8
  114. Disallow: */krasnojarsk-opt/
  115. Disallow: */samara-opt/ #9
  116. Disallow: */ufa-opt/ #10
  117. Disallow: */rostov-opt/ #11
  118. Disallow: */omsk-opt/ #12
  119. Disallow: */krasnodar-opt/ #13
  120. Disallow: */voronezh-opt/ #14
  121. Disallow: */perm-opt/ #15
  122. Disallow: */volgograd-opt/ #16
  123. Disallow: */saratov-opt/ #17
  124. Disallow: */tyumen-opt/ #18
  125. Disallow: */tjumen-opt/
  126. Disallow: */sochi-opt/ #44
  127. Disallow: */ivanovo-opt/ #51
  128. ## system hidden pages ##
  129. Disallow: *admin/
  130. Disallow: *helpdesk/
  131. Disallow: *yandexmarket/
  132. Disallow: *cml1c/
  133. Disallow: */vk/
  134. Disallow: */xml/
  135. Disallow: */yml/
  136. Disallow: */turbo/
  137. Disallow: */logs/
  138. Disallow: *multiform/
  139. Disallow: *webasyst/
  140. Disallow: */test/
  141. Disallow: */old/
  142. Disallow: *.html
  143. Disallow: *.php
  144. Disallow: *.pdf
  145. Disallow: */amp/
  146. ## info and service pages ##
  147. Disallow: *search
  148. Disallow: *mailer/
  149. Disallow: *login/
  150. Disallow: *signup/
  151. Disallow: *forgotpassword/
  152. Disallow: *order/
  153. Disallow: */cart/
  154. Disallow: *onestep/
  155. Disallow: *checkout/
  156. Disallow: */my/
  157. ## service links ##
  158. Disallow: *tel:
  159. Disallow: *skype:
  160. Disallow: *mailto:
  161. Disallow: *tg:
  162. Disallow: *viber:
  163. ## garbage and dublicates ##
  164. Disallow: *undefined
  165. Disallow: *compare/
  166. Disallow: *?
  167. Allow: *.*?
  168. Allow: *config/?
  169. Allow: *?page=
  170. Disallow: *?page=*&
  171. Disallow: *&page=
  172. Disallow: *?page=1
  173. Allow: *?page=10
  174. Allow: *?page=11
  175. Allow: *?page=12
  176. Allow: *?page=13
  177. Allow: *?page=14
  178. Allow: *?page=15
  179. Allow: *?page=16
  180. Allow: *?page=17
  181. Allow: *?page=18
  182. Allow: *?page=19
  183. Disallow: *?page=10*&
  184. Disallow: *?page=11*&
  185. Disallow: *?page=12*&
  186. Disallow: *?page=13*&
  187. Disallow: *?page=14*&
  188. Disallow: *?page=15*&
  189. Disallow: *?page=16*&
  190. Disallow: *?page=17*&
  191. Disallow: *?page=18*&
  192. Disallow: *?page=19*&
  193. Disallow: *product*/?page=
  194. ## blog garbage ##
  195. Disallow: */author/
  196. Disallow: */2015/
  197. Disallow: */2016/
  198. Disallow: */2017/
  199. Disallow: */2018/
  200. Disallow: */2019/
  201. Disallow: */2020/
  202. Disallow: */2021/
  203. Disallow: */2022/
  204. Disallow: */2023/
  205. Disallow: */2024/
  206. Disallow: */2025/
  207. Disallow: */2026/
  208. Disallow: */2027/
  209. Disallow: */2028/
  210. Disallow: */2029/
  211. Disallow: */2030/
  212. Disallow: */2031/
  213. Disallow: */2032/
  214. Disallow: */2033/
  215. Disallow: */2034/
  216. Disallow: */2035/
  217. Allow: /product/20*/
  218. Disallow: /product/20*/?
  219. ## individual rules ##
  220. Disallow: */tag/
  221. Disallow: */reviews/
  222. ## end ##
  223. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  224. Sitemap: https://site.ru/sitemap.xml
  225. User-agent: Googlebot
  226. ## system hidden pages ##
  227. Disallow: *admin/
  228. Disallow: *helpdesk/
  229. Disallow: *yandexmarket/
  230. Disallow: *cml1c/
  231. Disallow: */vk/
  232. Disallow: */xml/
  233. Disallow: */yml/
  234. Disallow: */turbo/
  235. Disallow: */logs/
  236. Disallow: *multiform/
  237. Disallow: *webasyst/
  238. Disallow: */test/
  239. Disallow: */old/
  240. Disallow: *.html
  241. Disallow: *.php
  242. Disallow: *.pdf
  243. ## info and service pages ##
  244. Disallow: *search
  245. Disallow: *mailer/
  246. Disallow: *login/
  247. Disallow: *signup/
  248. Disallow: *forgotpassword/
  249. Disallow: *order/
  250. Disallow: */cart/
  251. Disallow: *onestep/
  252. Disallow: *checkout/
  253. Disallow: */my/
  254. ## service links ##
  255. Disallow: *tel:
  256. Disallow: *skype:
  257. Disallow: *mailto:
  258. Disallow: *tg:
  259. Disallow: *viber:
  260. ## garbage and dublicates ##
  261. Disallow: *undefined
  262. Disallow: *compare/
  263. Disallow: *?
  264. Allow: *.*?
  265. Allow: *config/?
  266. Allow: *?page=
  267. Disallow: *?page=*&
  268. Disallow: *&page=
  269. Disallow: *?page=1
  270. Allow: *?page=10
  271. Allow: *?page=11
  272. Allow: *?page=12
  273. Allow: *?page=13
  274. Allow: *?page=14
  275. Allow: *?page=15
  276. Allow: *?page=16
  277. Allow: *?page=17
  278. Allow: *?page=18
  279. Allow: *?page=19
  280. Disallow: *?page=10*&
  281. Disallow: *?page=11*&
  282. Disallow: *?page=12*&
  283. Disallow: *?page=13*&
  284. Disallow: *?page=14*&
  285. Disallow: *?page=15*&
  286. Disallow: *?page=16*&
  287. Disallow: *?page=17*&
  288. Disallow: *?page=18*&
  289. Disallow: *?page=19*&
  290. Disallow: *product*/?page=
  291. Allow: *utm_source=
  292. ## blog garbage ##
  293. Disallow: */author/
  294. Disallow: */2015/
  295. Disallow: */2016/
  296. Disallow: */2017/
  297. Disallow: */2018/
  298. Disallow: */2019/
  299. Disallow: */2020/
  300. Disallow: */2021/
  301. Disallow: */2022/
  302. Disallow: */2023/
  303. Disallow: */2024/
  304. Disallow: */2025/
  305. Disallow: */2026/
  306. Disallow: */2027/
  307. Disallow: */2028/
  308. Disallow: */2029/
  309. Disallow: */2030/
  310. Disallow: */2031/
  311. Disallow: */2032/
  312. Disallow: */2033/
  313. Disallow: */2034/
  314. Disallow: */2035/
  315. Allow: /product/20*/
  316. Disallow: /product/20*/?
  317. ## individual rules ##
  318. Disallow: */tag/
  319. Disallow: */reviews/
  320. ## end ##
  321. Sitemap: https://site.ru/sitemap.xml
  322. User-agent: *
  323. ## googleonly usual storefronts ##
  324. Disallow: */msk/ #1
  325. Disallow: */moskva/
  326. Disallow: */spb/ #2
  327. Disallow: */novosibirsk/ #3
  328. Disallow: */nsk/
  329. Disallow: */ekb/ #4
  330. Disallow: */ekaterinburg/
  331. Disallow: */eburg/
  332. Disallow: */kazan/ #5
  333. Disallow: */nn/ #6
  334. Disallow: */chelyabinsk/ #7
  335. Disallow: */cheljabinsk/
  336. Disallow: */krasnoyarsk/ #8
  337. Disallow: */krasnojarsk/
  338. Disallow: */samara/ #9
  339. Disallow: */ufa/ #10
  340. Disallow: */rostov/ #11
  341. Disallow: */omsk/ #12
  342. Disallow: */krasnodar/ #13
  343. Disallow: */voronezh/ #14
  344. Disallow: */perm/ #15
  345. Disallow: */volgograd/ #16
  346. Disallow: */saratov/ #17
  347. Disallow: */tyumen/ #18
  348. Disallow: */tjumen/
  349. Disallow: */tolyatti/ #19
  350. Disallow: */toljatti/
  351. Disallow: */barnaul/ #20
  352. Disallow: */izhevsk/ #21
  353. Disallow: */mahachkala/ #22
  354. Disallow: */habarovsk/ #23
  355. Disallow: */ulyanovsk/ #24
  356. Disallow: */uljanovsk/
  357. Disallow: */irkutsk/ #25**************
  358. Disallow: */vladivostok/ #26
  359. Disallow: */yaroslavl/ #27
  360. Disallow: */jaroslavl/
  361. Disallow: */kemerovo/ #28
  362. Disallow: */tomsk/ #29
  363. Disallow: */naberezhnye-chelny/ #30
  364. Disallow: */sevastopol/ #31
  365. Disallow: */stavropol/ #32
  366. Disallow: */orenburg/ #33
  367. Disallow: */stavropol/ #34
  368. Disallow: */novokuzneck/ #35
  369. Disallow: */ryazan/ #36
  370. Disallow: */rjazan/
  371. Disallow: */balashiha/ #37
  372. Disallow: */penza/ #38
  373. Disallow: */cheboksary/ #39
  374. Disallow: */lipeck/ #40
  375. Disallow: */kaliningrad/ #41
  376. Disallow: */astrahan/ #42
  377. Disallow: */tula/ #43
  378. Disallow: */kirov/ #44
  379. Disallow: */sochi/ #45
  380. Disallow: */kursk/ #46
  381. Disallow: */ulan-udeh/ #47
  382. Disallow: */tver/ #48
  383. Disallow: */magnitogorsk/ #49
  384. Disallow: */surgut/ #50
  385. Disallow: */bryansk/ #51
  386. Disallow: */brjansk/
  387. Disallow: */ivanovo/ #52
  388. Disallow: */yakutsk/ #53
  389. Disallow: */jakutsk/
  390. Disallow: */vladimir/ #54
  391. Disallow: */simferopol/ #55
  392. Disallow: */belgorod/ #56
  393. Disallow: */nizhnij-tagil/ #57
  394. Disallow: */kaluga/ #58
  395. Disallow: */chita/ #59
  396. Disallow: */groznyj/ #60
  397. Disallow: */volzhskij/ #61
  398. Disallow: */smolensk/ #62
  399. Disallow: */podolsk/ #63
  400. Disallow: */saransk/ #64
  401. Disallow: */vologda/ #65
  402. Disallow: */kurgan/ #66
  403. Disallow: */cherepovec/ #67
  404. Disallow: */orel/ #68
  405. Disallow: */oryol/
  406. Disallow: */arhangelsk/ #69
  407. Disallow: */vladikavkaz/ #70
  408. Disallow: */nizhnevartovsk/ #71
  409. Disallow: */yoshkar-ola/ #72**********
  410. Disallow: */sterlitamak/ #73
  411. Disallow: */murmansk/ #74
  412. Disallow: */kostroma/ #75
  413. Disallow: */novorossijsk/ #76
  414. Disallow: */tambov/ #77
  415. Disallow: */himki/ #78
  416. Disallow: */mytischi/ #79********
  417. Disallow: */nalchik/ #80********
  418. Disallow: */taganrog/ #81
  419. ## googleonly opt storefronts ##
  420. Disallow: */msk-opt/ #1
  421. Disallow: */moskva-opt/
  422. Disallow: */spb-opt/ #2
  423. Disallow: */novosibirsk-opt/ #3
  424. Disallow: */nsk-opt/
  425. Disallow: */ekb-opt/ #4
  426. Disallow: */ekaterinburg-opt/
  427. Disallow: */eburg-opt/
  428. Disallow: */kazan-opt/ #5
  429. Disallow: */nn-opt/ #6
  430. Disallow: */chelyabinsk-opt/ #7
  431. Disallow: */cheljabinsk-opt/
  432. Disallow: */krasnoyarsk-opt/ #8
  433. Disallow: */krasnojarsk-opt/
  434. Disallow: */samara-opt/ #9
  435. Disallow: */ufa-opt/ #10
  436. Disallow: */rostov-opt/ #11
  437. Disallow: */omsk-opt/ #12
  438. Disallow: */krasnodar-opt/ #13
  439. Disallow: */voronezh-opt/ #14
  440. Disallow: */perm-opt/ #15
  441. Disallow: */volgograd-opt/ #16
  442. Disallow: */saratov-opt/ #17
  443. Disallow: */tyumen-opt/ #18
  444. Disallow: */tjumen-opt/
  445. Disallow: */sochi-opt/ #44
  446. Disallow: */ivanovo-opt/ #51
  447. ## system hidden pages ##
  448. Disallow: *admin/
  449. Disallow: *helpdesk/
  450. Disallow: *yandexmarket/
  451. Disallow: *cml1c/
  452. Disallow: */vk/
  453. Disallow: */xml/
  454. Disallow: */yml/
  455. Disallow: */turbo/
  456. Disallow: */logs/
  457. Disallow: *multiform/
  458. Disallow: *webasyst/
  459. Disallow: */test/
  460. Disallow: */old/
  461. Disallow: *.html
  462. Disallow: *.php
  463. Disallow: *.pdf
  464. Disallow: */amp/
  465. ## info and service pages ##
  466. Disallow: *search
  467. Disallow: *mailer/
  468. Disallow: *login/
  469. Disallow: *signup/
  470. Disallow: *forgotpassword/
  471. Disallow: *order/
  472. Disallow: */cart/
  473. Disallow: *onestep/
  474. Disallow: *checkout/
  475. Disallow: */my/
  476. ## service links ##
  477. Disallow: *tel:
  478. Disallow: *skype:
  479. Disallow: *mailto:
  480. Disallow: *tg:
  481. Disallow: *viber:
  482. ## garbage and dublicates ##
  483. Disallow: *undefined
  484. Disallow: *compare/
  485. Disallow: *?
  486. Allow: *.*?
  487. Allow: *config/?
  488. Allow: *?page=
  489. Disallow: *?page=*&
  490. Disallow: *&page=
  491. Disallow: *?page=1
  492. Allow: *?page=10
  493. Allow: *?page=11
  494. Allow: *?page=12
  495. Allow: *?page=13
  496. Allow: *?page=14
  497. Allow: *?page=15
  498. Allow: *?page=16
  499. Allow: *?page=17
  500. Allow: *?page=18
  501. Allow: *?page=19
  502. Disallow: *?page=10*&
  503. Disallow: *?page=11*&
  504. Disallow: *?page=12*&
  505. Disallow: *?page=13*&
  506. Disallow: *?page=14*&
  507. Disallow: *?page=15*&
  508. Disallow: *?page=16*&
  509. Disallow: *?page=17*&
  510. Disallow: *?page=18*&
  511. Disallow: *?page=19*&
  512. Disallow: *product*/?page=
  513. ## blog garbage ##
  514. Disallow: */author/
  515. Disallow: */2015/
  516. Disallow: */2016/
  517. Disallow: */2017/
  518. Disallow: */2018/
  519. Disallow: */2019/
  520. Disallow: */2020/
  521. Disallow: */2021/
  522. Disallow: */2022/
  523. Disallow: */2023/
  524. Disallow: */2024/
  525. Disallow: */2025/
  526. Disallow: */2026/
  527. Disallow: */2027/
  528. Disallow: */2028/
  529. Disallow: */2029/
  530. Disallow: */2030/
  531. Disallow: */2031/
  532. Disallow: */2032/
  533. Disallow: */2033/
  534. Disallow: */2034/
  535. Disallow: */2035/
  536. Allow: /product/20*/
  537. Disallow: /product/20*/?
  538. ## individual rules ##
  539. Disallow: */tag/
  540. Disallow: */reviews/
  541. ## end ##
  542. Crawl-delay: 5
  543. Sitemap: https://site.ru/sitemap.xml
  544. User-agent: Mediapartners-Google
  545. Allow: /
  546. Crawl-delay: 3
Инструкция по внедрению robots.txt на региональные поддомены сайта
  1. Скопируйте себе весь код для региональных поддоменов.
  2. Если вы используете страницы тегов в качестве посадочных страниц - удалите строчки "Disallow: /tag/" и "Disallow: */tag/".
  3. Если вы используете страницы отзывов о товарах в качестве посадочных страниц - удалите строчку "Disallow: */reviews/".
  4. Если вам необходимо добавить дополнительные директивы - рекомендую вывести их в блоке "## individual rules ##".
  5. Введите итоговый код:
    • Если вы используете плагин "SEO-регионы", то перейдите на страницу "/webasyst/shop/?plugin=regions&action=robots", вставьте код туда, выберите все региональные витрины (т.е. все витрины кроме основной) и нажмите кнопку "Сохранить".
    • Если вы не используете плагин "SEO-регионы", то заходите в настройки сайта и поочередно выбирая все региональные витрины, вставляйте код и сохраняйте изменения, не забывая при этом заменять в строчке "Sitemap: https://{storefront_url}/sitemap.xml" фрагмент "{storefront_url}" на домен вашей региональной витрины (пример: "Sitemap: https://spb.test.ru/sitemap.xml").
  6. Обязательно проверьте файл robots.txt на региональных витринах после внесения изменений (доступны по адресу https://spb.site.ru/robots.txt, https://ufa.site.ru/robots.txt, https://omsk.site.ru/robots.txt, итд).

Шаблон robots.txt для региональных поддоменов

  1. #upd 19.09.2022
  2. #author: @anatoly_chikurov
  3. User-agent: *
  4. Disallow: /
  5. User-agent: Yandex
  6. ## googleonly pages ##
  7. ## content pages ##
  8. Disallow: */blog/
  9. Disallow: */stati/
  10. Disallow: */novosti
  11. Disallow: */seorating/
  12. Disallow: */rating/
  13. ## system hidden pages ##
  14. Disallow: *admin/
  15. Disallow: *helpdesk/
  16. Disallow: *yandexmarket/
  17. Disallow: *cml1c/
  18. Disallow: */vk/
  19. Disallow: */xml/
  20. Disallow: */yml/
  21. Disallow: */turbo/
  22. Disallow: */logs/
  23. Disallow: *multiform/
  24. Disallow: *webasyst/
  25. Disallow: */test/
  26. Disallow: */old/
  27. Disallow: *.html
  28. Disallow: *.php
  29. Disallow: *.pdf
  30. Disallow: */amp/
  31. ## info and service pages ##
  32. Disallow: *search
  33. Disallow: *mailer/
  34. Disallow: *login/
  35. Disallow: *signup/
  36. Disallow: *forgotpassword/
  37. Disallow: *order/
  38. Disallow: */cart/
  39. Disallow: *onestep/
  40. Disallow: *checkout/
  41. Disallow: */my/
  42. ## service links ##
  43. Disallow: *tel:
  44. Disallow: *skype:
  45. Disallow: *mailto:
  46. Disallow: *tg:
  47. Disallow: *viber:
  48. ## garbage and dublicates ##
  49. Disallow: *undefined
  50. Disallow: *compare/
  51. Disallow: *?
  52. Allow: *.*?
  53. Allow: *config/?
  54. Allow: *?page=
  55. Disallow: *?page=*&
  56. Disallow: *&page=
  57. Disallow: *?page=1
  58. Allow: *?page=10
  59. Allow: *?page=11
  60. Allow: *?page=12
  61. Allow: *?page=13
  62. Allow: *?page=14
  63. Allow: *?page=15
  64. Allow: *?page=16
  65. Allow: *?page=17
  66. Allow: *?page=18
  67. Allow: *?page=19
  68. Disallow: *?page=10*&
  69. Disallow: *?page=11*&
  70. Disallow: *?page=12*&
  71. Disallow: *?page=13*&
  72. Disallow: *?page=14*&
  73. Disallow: *?page=15*&
  74. Disallow: *?page=16*&
  75. Disallow: *?page=17*&
  76. Disallow: *?page=18*&
  77. Disallow: *?page=19*&
  78. Disallow: *product*/?page=
  79. ## blog garbage ##
  80. Disallow: */author/
  81. Disallow: */2015/
  82. Disallow: */2016/
  83. Disallow: */2017/
  84. Disallow: */2018/
  85. Disallow: */2019/
  86. Disallow: */2020/
  87. Disallow: */2021/
  88. Disallow: */2022/
  89. Disallow: */2023/
  90. Disallow: */2024/
  91. Disallow: */2025/
  92. Disallow: */2026/
  93. Disallow: */2027/
  94. Disallow: */2028/
  95. Disallow: */2029/
  96. Disallow: */2030/
  97. Disallow: */2031/
  98. Disallow: */2032/
  99. Disallow: */2033/
  100. Disallow: */2034/
  101. Disallow: */2035/
  102. Allow: /product/20*/
  103. Disallow: /product/20*/?
  104. ## individual rules ##
  105. Disallow: */tag/
  106. Disallow: */reviews/
  107. ## end ##
  108. Clean-param: from&clid&pclid&promo&utm&utm_referrer&utm_medium&utm_source&utm_campaign&utm_term&utm_content&gclid&openstat&cpc&test&dev&sort&order&tip&tsvet&brend&brand&strana&price_min&price_max&showall&frommarket&nomobile&mobile&crcy&promo_id
  109. Sitemap: https://{storefront_url}/sitemap.xml
Написать комментарий
11 комментариев
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова26 декабря 2020 13:32
Обновление #upd 26.12.2020
— снят запрет с индексации .js, .css, и прочих файлов, если они подключены с get-параметрам, содержащими информацию о версии файлов
— снят запрет для индексации страниц товаров c рекламными UTM-метками для Googlebot
— снят запрет для индексации AMP-страниц для Googlebot
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова18 января 2021 06:40
Обновление #upd 18.01.2020
— удаление лишних директив
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова6 февраля 2021 12:17
Обновление 06.02.2020
— новая группа правил ## googleonly pages ## (для проектов, на которых реализовано продвижение папками в Google)
— новая группа правил ## content pages ## (для проектов, на которых имеется блог и/или используется плагин "SEO-топы и списки")
В
ВЕталВеб-студия Анатолия Чикурова28 апреля 2021 23:39
Добрый!
Расскажите по подробней пожалуйста о директиве:

## googleonly pages ##
Disallow: */spb/
Disallow: */spb-opt/
Disallow: */ekb/
Disallow: */ekb-opt/
Disallow: */novosibirsk/

Вы пишите , что "Данный шаблон robots.txt подойдет для 99% интернет-магазинов". Я например на сайтах не использую подобных каталогов, я использую субдомены. Соответственно мне закрывать в роботсе нет смысла региональные каталоги, и исходя из этого мне можно удалить эту часть роботса? или я не правильно понял назначение директивы ## googleonly pages ## ?

И ещё в вашем шаблоне роботса региональные каталоги закрыты (Disallow) и для основного домена и для регионального, в чём фишка?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова29 апреля 2021 11:13
Фишка в том, что папки индексируются только у основного домена и только в гугле.

Если вы не используете папки для продвижения в Google, то закрыв их от индексации вы в общем-то ничего не потеряете. Будет лишь несколько лишних строк в robots.txt, которые ничего не делают. Хотите их удалить - удаляйте.
Д
ДенисВеб-студия Анатолия Чикурова21 июня 2021 17:11
Добрый день.
Надо ли что то менять в файлах robots, предоставленных Вами, если у меня интернет магазин на поддоменах xxx.site.ru ?
В региональном файле Вы закрыли индексацию для всех поисковиков кроме Яндекса. На сколько понял это нужно для сайтов на папках. Нужно ли это делать в моем случае? Для Чего нужен User-agent: Mediapartners-Google на основной витрине?
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова22 июня 2021 14:56
Денис, для начала, немного "моей" терминалогии:
- "витрина на поддомене" - это сайт вида msk.site.ru
- "витрина на папке" - это витрина сайта вида site.ru/msk/

Гугл очень неохотно индексирует/ранжирует поддомены. Но папки воспринимает нормально, если все грамотно настроено.

Яндекс, напротив, хорошо воспринимает поддомены. В идеале на сайте нужно реализовывать гибрид поддоменов и папок: поддомены кормить Яндексу, папки кормить Гуглу.

Скорее всего у вас все реализовано на поддоменах, а не на папках (я не встречал ни одного сайта на Webasyst, сделанного не мной, на котором грамотно настроены папки для гугла).

Файл robots.txt, представленный на данной странице, универсален - его можно в неизменном виде внедрять и на проекты на поддоменах, и на проекты на папках, и на проекты с гибридной системой. Если у вас не реализованы папки и вы не удалите правила, которые используются в файле-шаблоне robots.txt, то у вас просто будут лишние строки, которые абсолютно ни на что не влияют.

---

Что касается "User-agent: Mediapartners-Google" - долго объяснять. Если вкратце, это правило было добавлено для снятия запрета на индексацию страниц товаров с GET-параметрами для гугловского робота, который парсит сайт с целью сбора информации для рекламных сервисов (в частности, для сервиса "Google Покупки").

Однако на практике это не всегда работает, поскольку Google сам же перестал следовать своей документации и за информацией на сайт часто приходят обычные "нерекламные" роботы. Подозреваю, что это недоразумение связано с переходом на Mobile First индексацию и в будущем специалисты Google это исправят. Ну а пока что в robots.txt приходится добавлять строчку "Allow: *utm_source=", во избежание проблем работы магазина на сервисе "Google Покупки".

---

В любом случае, рекомендую вам следовать стандартному шаблону. Он проверен на огромном количестве сайтов и действительно является универсальным решением.
Чикуров Анатолий
Чикуров АнатолийВеб-студия Анатолия Чикурова8 августа 2021 09:17
Обновление #upd 08.08.2021
— добавлены новые правила для запрета сканирования некоторых страниц пагинаций
Л
Лаба ИльяВеб-студия Анатолия Чикурова14 декабря 2021 16:37
Анатол