محتوای تکراری یا duplicate content یکی از معضل های بزرگی است که مدیران سایت و وبمسترها خواسته یا ناخواسته احتمالا با آن روبه رو میشوند. از آن جا که سئو و بازاریابی محتوایی مکمل همدیگر هستند، محتوای تکراری هم میتواند یکی از اشتباهات رایج تولید محتوا و هم یکی از اشتباهات رایج سئو باشد.
در این پست آموزشی از کامی سئو قصد داریم که با هم به بحث محتوای تکراری یا duplicate content بپردازیم و راه های جلوگیری از آن را بیان کنیم. پس با ما همراه باشید.
محتوای تکراری یا duplicate content چیست؟

محتوای تکراری به طور کلی به بلوک های قابل توجهی از محتوا در داخل سایت گفته میشود که یا کاملاً با محتوای دیگر مطابقت دارند یا به طور قابل ملاحظه ای مشابه هستند. محتوای تکراری همچنین به محتوایی گفته می شود که در چند صفحه از یک وبسایت یا با چند صفحه از چند وبسایت دیگر مطابقت دارد.
همچنین محتوای تکراری یا اصطلاحا Duplicate Content، به محتوایی گفته میشود که در چند جا از اینترنت به صورت کاملا یکسان موجود است. منظور از یک جا، یک آدرس اینترنتی (یو ار ال) است. بنابراین اگر شما دید که یک محتوای شما با چند یو ار ال مختلف بالا آمد، شما دچار مشکل محتوای تکراری شده اید.
شاید شما با محتوای تکراری دچار جریمه از طریق گوگل و سایر موتورهای جستجو نشوید، اما به دلیل سردرگمی گوگل برای اینکه کدام آدرس یا یوارال را بالا بیارد، سایت شما دچار افت رتبه میشود.
مشکلات ناشی از محتوای تکراری

محتوای تکراری از دو جهت ممکن است برای یک کسب و کار مشکل به بار بیاورد. یکی برای موتورهای جستجو که آن ها را سردرگم میکند و دیگری برای صاحبان کسب و کار و وب سایت هایی که از این مشکل رنج میبرند.
مشکل محتوای تکراری برای موتورهای جستجو
duplicate content سه مشکل اساسی زیر را برای موتورهای جستجو به وجود می آورد.
- سردرگمی برای اینکه کدام آدرس را به ازای جستجو را به کاربران نشان دهند، یا کدم را حذف کنند.
- سردرگمی برای اینکه اعتبار کارهای سئو مانند لینک سازی و… را به کدام صفحه بدهدند.
- همچنین سردرگمی برای اینکه برای یک کوئری مورد جستجوی خاص، کدام یک را رتبه بندی کنند.
مشکل محتوای تکراری برای صاحبان وبسایت و خود سایت
از دست دادن رتبه و ترافیک ارگانیک در محتوای تکراری یا duplicate content از اصلی ترین مشکلات برای یک وبسایت است که به دو دلیل زیر اتفاق میافتد.
- جهت ارائه بهترین نتیجه در ازای جستجو، موتورهای جستجو همه لینک های یک سایت را در ازای یک کلمه به آن ها نشان نمیدهند، آن ها یکی را به انتخاب به کاربر نشان میدهند که ممکن است از بقیه محتوای قوی تر نباشد و یا به دلیل وجود آن ها ضعیف ظاهر شود.
- توازن لینک دهی به سایت شما بهم میخورد افراد و وبسایت ها به طور دلخواه به محتوا های شام لینک میدهند و قدرت همه کند پیش میرود و این اصلا چیز جالبی نیست.
علت به وجود آمدن محتوای تکرای چیست؟

طبق آمار خود گوگل و منابع معتبر دیگر از کمپانی های بیگ دیتا، ٢٩ در صد از حجم کل محتوای وب تکرای هستند. خیلی از اوقات ما به عنوان یک مدیر سایت و یا تولید کننده محتوا عمدا محتوای تکرای ایجاد نمیکنیم، اما باز هم محتوای تکراری امکان دارد به وجود بیاید. در ادامه علت به وجود آمدن محتوای تکرای را مورد بررسی قرار میدهیم. این دلایل به صورت فهرست زیر است.
- پارامترهای مربوط به آدرس صفحات
- Session ID
- قابلیت پرینت صفحه
- محتوای کپی شده
- مشکلات مربوط به HTTP و HTTPS، و صفحات با www و بدون www
- برچسب ها
پارامتر مربوط به آدرس صفحات در duplicate content
فاکتورهای مربوط به آدرس سایت و URL ها مانند پارامترهایی که برای ردیابی کلیک ها و برخی از کدهای تحلیلی می توانند در به وجود آمدن محتوای تکراری موثر واقع شوند. پارامترهای خود یوارال و توالی تولید و ایجاد آن ها میتواند به دوپلیکیت کانتنت منجر شود. به نمونه یوارال زیر که منجر به محتوای تکراری شده است دقت کنید.
- آدرس اینترنتی www.example.com/blue-widgets?color=blue در واقع، دوپلیکیت کانتنت www.example.com/blue- سایت example است.
- آدرس اینترنتی www.example.com/blue-example?color=blue&cat=3 محتوای تکراری یوارال www.example.com/blue-example?cat=3&color=blue است.
Session ID ها در خلق دوپلیکیت کانتنت
زمانی که هر کاربرای به ازای هر نشتی که در سایت دارد، یک Session ID دریافت کند، این Session ID ها یک نوع محتوای تکراری به حساب می آیند.
صفحات قابل پرینت و نقش آن ها در ایجاد محتوای تکراری
صفحاتی از وبسایت که گزینه پرینت گرفتن را در اختیار یوزرهای خود قرار میدهند میتوانند نوعی محتوای تکراری ایجاد کنند. این اتفاق زمانی میافتد که نسخه های متفاوتی از یک صفحه وب در گوگل ایندکس میشود. بنابراین زمانی که شما بر روی گزینه پریتنت کلیک میکنید، صفحه ای جدید با محتوای یکسان ولی آدرس متفاوت ایجاد میشود که یک نوع محتوای تکراری به حساب می آید.
کپی محتوا
کپی کردن محتوای دیگران در سایت خود و یا کپی کردن محتوای سایت خود در صفحات دیگر سایت یک نوع محتوای تکراری محوسب میشود و یک سینگنال منفی به گوگل میفرستد. این محتوا میتوانند مقالات وبلاگ، معرفی محصولات و یا هر چیز دیگری نیز باشند.
یکی از اصول سئوی محتوا تکراری و کپی نبودن این محتوا در سطح وب است که یونیک بودن آن از اهمیت ویژه ای برخوردار است. ما در همه تک تک مقالات آموزش سئوی محتوا به این نکته توجه کرده ایم و آن را به خوبی پوشش داده ایم تا به دوپلیکیت کانتنت گرفتار نشوید.
مشکلات مربوط به HTTP و HTTPS، و صفحات با www و بدون www
یکی از مشکلات اصلی بیشتر سایت های غیر حرفه ای، همیمن مشکل است. خیلی از سایت ها با هر چهار آدرس گفته شده بالا می آیند که هر کدام از آن ها آدرس متفاوتی به حساب می آیند. یکی از تکنیک های سئو تکنیکال که در داخل سرچ کنسول گوگل قابل پیگیری است، معرفی کردن نسخه اصلی سایت به گوگل است که معمولا با https انجام میشود.
یعنی وقتی کاربر هر کدام یک از آدرس های شما را در مرورگر باز کرد، نسخه اصلی آن یعنی https://example.com بالا بیاد. در غیر این صورت یک محتوای شما به صورت چهار محتوای مختلف درمیاد و یک سینگنال منفی برای گوگل به حساب می آید.
برچسب ها
یکین از عوامل مهمی که در ایجاد محتوای تکراری نقش دارد، استفاده غیر اصولی از برچسب ها در مقالات، محصولات و صفحات سایت است. گاهی اوقات پیش میاد که ما در یک صفحه از دو تگ یکسان استفاده میکنیم، این یکسان بودن باعث به وجود آمدن دو صفحه مجزا میشود که کانسپت کلمه کلیدی آن ها یکسان و یک نوع محتوای تکراری به حساب می آید.
برای اینکه در برچسب گذاری در سایت دچار دوپلیکیت کانتنت نشویک بایستی که این عمل را طبق اصول و به صورت صحیح انجام دهیم. مقاله ما تحت عنوان اصول صحیح برچسب گذاری در سایت میتواند برای شما مفید باشد.
چگونگی رفع دوپلیکیت کانتنت

هنگامی که یک محتوا از یک سایت با آدرس های متعددی در گوگل و سایر موتورهای جستجو بالا می آید، باید برای این موتورهای جستجو گر (Canonicalized) انجام شود. یا اینکه url جعلی را به url اصلی ریدایرکت ٣٠٢ کرد. این کار توسط افزونه ها و ابزارهای متعددی انجام میشود.
به صورت کلی پنج راهکار برای رفع مشکل محتوای تکراری وجود دارد که ما در کامی سئو به همه آن ها شاره خواهیم کرد. این ٥ راهکار عبارت اند از:
- ریدایرکت ٣٠١
- تگ کنونیکال
- Taxonomy
- مدیریت پارامترها و معرفی آدرس اصلی
- تگ گذاری no index و nofollow
ریدایرکت ٣٠١
بیشتر اوقات بهترین روش جلوگیری از بروز محتوای تکراری ریدایرکت 301 از صفحه جعلی به صفحه اصلی حاوی محتوا است. هنگامی که شما از این ریدایرکت استفاده میکنید، نه تنها صفحات شما با همدیگر رقابت نمیکنند، بلکه باعث قدرت بخشیدن به محتوای اصلی نیز میشوند.
تگ کنونیکال برای رفع مشکل محتوای تکراری
راهکار دیگر حل مشکل محتوای تکراری، استفاده از تگ rel=canonical در صفحاتی است که تکراری به حساب می آیند. این تگ برای موتورهای جستجو به این معنی تفسیر میشود که این صفحه محتوای تکراری از یک صفحه دیگر است و اعتبار آن باید به صفحه اصلی محتوا داده شود.
متا تگ rel=canonical باید به قسمت هدر تمام صفحات تکراری و همچنین صفحه محتوای اصلی نیز اضافه شود. دقت کنید که کوتیشن ها را حتما قرار دهید. این متا تگ درست مانند ریدایرکت 301، همه اعتبار صفحات تکراری را به صفحه محتوا اصلی منتقل میکند و به خاطر اینکه در سطح خود صفحه اجرا میشود و سرور را درگیر نمیکند، مدت زمان کمتری برای تاثیر گذاری نیاز دارد.
نمونه ای از متا تگ کنونیکال :
<link href="http://www.example.com/canonical-version-of-page/" rel="canonical" />
Taxonomy
در آغاز کار، به Taxonomy سایت خود یک نگاه کلی داشته باشید. فرقی نمی کند که یک محتوای جدید، فعلی یا ویرایش شده داشته باشید، نقشه برداری از صفحات از یک Crawl و قرار دادن یک H1 یکتا و یک کیوورد اصلی یکتا یک شروع عالی است. برای جلوگیری از بروز محتوای تکراری یا duplicate content است. سازماندهی محتوای وب سایت خود به صورت دسته بندی های موضوعی میتوان به شما در این راه کمک فراوانی بکند.
مدیریت پارامترها آدرس برای جلوگیری از duplicate content
پارامترهای مربوط آدرس صفحات نشان می دهند که چطور می توان سایت را به صورت بهتر توسط ربات های موتور جستجو بررسی کرد. پارامترهای آدرس امکان دارد موجب duplicate content شوند. به عنوان مثال، اگر چند صفحه محصول متفاوت از یک محصول مشخص وجود داشته باشد، این یک محتوای تکراری از دید موتور جستجو به حساب می آید.
سرچ کنسول گوگل به وبمستر ها این امکان را می دهد که از بین نسخه با www و بدون www، نسخه انتخابی خود را برای ایندکس و نمایش توسط ربات های گوگل انتخاب کنند. همچنین می توان پارامترهایی که نیازی به کروال و ایندکس ندارند را نیز در قسمت مربوطه مشخص کنند.
همچنی زمانی که شما از ssl استفاده میکنید نیز دو آدرس متفاوت دیگر برای گوگل قابل شناسایی است. سایت با https و سایت بدون https که باز هم باید در سرچ کنسول گوگل آدرس اصلی (با https) را معرفی کنید.
بسته به ساختار آدرس سایتتان و عوامل ایجاد کننده دوپلیکیت کانتنت، استفاده از راهکارهای انتخاب آدرس اصلی و ارجح و کنترل پارامترها می تواند در بروز دوپلیکیت کانتنت بسیار موثر باشد. یک نکته این جا حائز اهمیت است که کنترل پارامترهای آدرس مختص گوگل است و در سایت موتورهای جستجو این امکان وجود ندارد.
تگ گذاری noindex و nofollow
متا تگ های گوگل با مقادیر noindex, follow در یک صفحه برای جلوگیری از بروز محتوای تکراری استفاده کرد. این متا تگ به ربات های گوگل میگویند که که صفحه مورد نظر نباید در موتورهای جستجوگر ایندکس یا فهرست بندی شود. با این کار صفحات شما crawl میشوند اما از ایندکس شدن در امانند و بنابراین صفحات مشابه با صفحات اصلی را میتوان با استفاده از این متا تگ ها ایجاد کرد، بدون اینکه مشکل سئویی برای شما به وجود بیاورد.
نمونه ای از استفاده این متاتگ ها:
<head> <meta name="robots" content="noindex, follow" /> </head>
چگونگی پیداکردن محتوای تکراری سایت
روش های مختلفی برای پیداکردن محتوای تکراری وب سایت وجود دارد. اما بهترین رروشه برای پیداکردن محتوای تکراری سایت استفاده از وب سایت های آنلاین و ابزارهای وب محور است که میتواند به سئوی سایت شما کمک زیادی کند. در زیر چند روشه بارای یافتن دوپلیکیت کانتنت سایت معرفی کرده ایم :
١- سایت siteliner.com
وب سایت siteliner.com یک ابزا ایده آل برای پیداکردن محتواهای تکراری در سایت شما است. نحوه کار به این صورت است که شما آدرس سایت خود را در آة وارد میکند و این سایت به سرعت محتواهای داپلیکیت را میابد. این ابزار کاملا رایگان بوده و رابط کاربری آسانی دارد.
٢- ابزار Copyscape
یک ابزار محبوب دتگر برای یافتن محتوای تکرای است که کل محتوای سایت شما را چک کرده و محتوای تکراری آة را در سطح وب پیدا میکند. این ابزار محتوای وب سایت شما را با کل محتوای موجود در سطح وب میسنجد و تکرای یا کپی بودن آن را به شما نشان میدهد. به نمونه ۆایین توجه کنید، این یک نمونه از محتوای تکراری و کپی شده است که این وبسایت آة را میابد.

نکات تکمیلی در رابطه با جلوگیری از بروز duplicate content
- استراتژی لینک سازی داخلی فقط و فقط با استفاده با یک فرمت. مثلا با https یا بدون https یا با www یا بدون www برای کلیه لینک های داخلی. فقط اصلی را به کار ببرید
- برای لینک سازی خارجی نیز گزینه قبلی را به کار بگیرید.
- برای جلوگیری از کپی مطالب شما در وب، از تگ کنونیکال در محتوای اصلی خود استفاده کنید تا با استفاده از محتوای شما در سطح وب، اعتبار آن ها به محتوای اصلی شما انتقال داده شود.
سخن پایانی
وجود محتوای تکراری در وبسایت شما به گرفتن ترافیک ارگانیک و سئوی سایت شما ضربه میزند و ساختار سایت شما را ضعیف خواهد کرد. برای جلوگیری از ایجاد duplicate content روش های بالا را حتما به کار بگیرید. دقت داشته باسید اگر در سایت شما محتوای تکراری به وجود بیاید موجب کنیبالیزیشن یا هم خواری صفحات میشود و صفحات شما هرگز رشد نخواهند کرد.
منبع مورد استفاده: سایت moz
سفارش تولید محتوای متنی با کامی سئو


کامل بهرامی: دانشآموخته کارشناسی ارشد رشته مهندسی کامپیوتر گرایش نرمافزار از دانشگاه ارومیه هستم. به حوزه کامپیوتر، برنامهنویسی و فناوری اطلاعات علاقهمندم و در حوزههای مذکور در مکتب خونه، مجله فرادرس، هاست ایران، مدیااد، تپسل، متریکس، سبز لرن و غیره تولید و ویراستاری محتوا انجام میدهم. هماکنون سه سال است که در این حوزه مشغول به کار هستم و بالای 6000 مقاله در سطح وب دارم. از سال ١٤٠١ به بعد به عنوان ویراستار و مدیر تیم نویسندهها در مکتب خونه فعالیت مستمر دارم.




وقتی مثلا دوتا محصول یا دوتاکفش دقیقا یک مدل هستن و لی رنگشون متفاوته چیکار باید بکنیم؟؟ براش دوتا صفحه جدا بزنیم میشود محتوای تکراری؟ بنده خیلی وارد نیستم
دو تا صفحه جدا نمیخواد، معمولا اگر از وردپرس استفاده میکنید تو گزینه محصول متغیر رنگ را به عنوان یک فیچر متغیر انتخاب میکنی و نیازی به ساخت یک صفحه جدیدی نیست. یا برای هر ویژگی دیگر نیز میتوان اینو به کار برد. اکبته بنده با بقیه سیستم های مدیریت محتوا کار نکردم ولی احتمالا اوناهم همچنین گزینه ای دارند حتما
با سلام. خیلی جالب بود مخصوصا انو بخش اینفوگرافیکش که خودنم همه چی تفهیم شد. برای محتوایی که مشابه هستند میتونیم کلمه کلیدی یکیشونو تغیر بدیم؟
با تغیر کلمه کلیدی کانسپت حوض میشه که محتوا هم طبیعتا باید عوض بشه. اگر کلمه کلیدی از جنبه کانسپت تغیر نمیدید بهتره از کنونیکال یا ریدیرکت استفده کنین
سلام. ممکنه شامل جریمه گوگل با محتوای تکراری بشیم؟
محتوا اگر کپی نباشه و از جای دیگر کپی نکرده باشین، جریمه نخواهید شد ولی در این شرایط صفحاتتون با هم رقابت میکنند که به ضرر شماست
سلام. کپی از یک سایت چرا دوپلیکیت کانتت ب خساب میاد؟ اون موقع ک صفحات خودمون باهم رقابت نمیکنن که؟
بله اگر دقیقا کپی باشه محتوای تکراری به حساب میاد و گوگل ما را جریمه هم خواهد کرد
عکس های تکراری در صفحه هم محتوای تکراری به حساب میاد؟
بله قطعا. سعی کنید که عکس های یونیک استفاده کنید
سلام. ممنون برای مقاله خوبتون. استفاده از ویدیوهای دیگران محتوای تکرای محسوب میشه؟
سلام. من ی محصول دارم که این محصول باکلمات مختلفی سرچ میشه. ایا اگر برای هر کلمه ش یک صفحه بزنم دچار محتوای تکراری میشم؟ در این مورد چیکار کنم که duplicate content به وجود نیاد؟
سلام، برای اینکه در این شرایط دچار دوپلیکیت کانتنت نشوید لازمه که کلمات کلیدی که توسط کاربران سرچ میشه را تحلیل کنید. ممکن است که برای یک محصول با دو رنگ، مردم آن ها را با رنگ سر چ بزنند و بهتر باشه برای هر کدام یک صفحه مجزا بسازید و بر عکس