تنتشر في الصحافة الدولية، ظاهرة تسمى بالكتب المسموعة أو "الكتب الناطقة"، والتي تعد حديثة إلى حد ما، حيث بدأت في الثلاثينيات من القرن الماضي وكانت متاحًة للاستخدام لخدمة ضعاف البصر. ولم تبدأ الكتب المسجلة على شريط حتى سبعينيات القرن الماضي، حيث استخدمت لخدمة الركاب، إلا أن الأداة لم تنطلق إلا بعد أن تم إضافتها إلى الهواتف الذكية، فمنذ بداية عصر "آيفون" نمت الكتب الصوتية بشكل مطرد، حيث قطعت الصناعة عشر سنوات من النمو، وهو اتجاه من المتوقع أن يتسارع، مع اتجاه شركات "أمازون" و"أبل" و"جوجل" لاستنساخ أجهزة تحاكي الصوت البشري بالذكاء الاصطناعي.
ووفقًا لتوقعات شركة "وورد سرايتد"، المعنية بأبحاث صناعة النشر، يمكن تقدير مبيعات قطاع الكتب المسموعة حاليًا بأكثر من 5 مليارات دولار، وما يقرب من 2 مليار دولار منها في الولايات المتحدة وحدها، والتي تعد أكبر سوق للكتب الصوتية في العالم. ومن المتوقع أن تنمو الإيرادات بنسبة 26.4٪ كل عام اعتبارًا من عام 2022 حتى عام 2030.
وتوقع بحث "وورد سرايتد" أن تصل مبيعات الكتب المسموعة إلى ما يزيد عن 35 مليار دولار بحلول 2030، وهذا يجعل الكتب الصوتية "الكتب الأسرع نموًا في العالم بهامش واسع"، كما أنه يجعل الكتب الصوتية سوقًا آخر للذكاء الاصطناعي، مع تنامي الأصوات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، عبر محاكاة ميكروفونية للمؤديين الصوتيين.
ويوفر "جوجل بلاي" من شركة "جوجل" للناشرين القدرة على إنشاء كتب صوتية يتم سردها تلقائيًا طالما أن الناشرين يمتلكون حقوق الكتاب المسموع أو المقال المسموع، ويختارون السرد التلقائي.
ولا يتم أياً من ذلك دون موافقة الناشر، كما أنه ليس شيئًا يمكن لأي مستهلك إنشاؤه بشكل قانوني بمفرده.
قالت جودي تشانج، مديرة إدارة المنتجات في كتب "جوجل بلاي": "بالنسبة للعديد من الناشرين يمكن أن يكون إنتاج الكتب المسموعة استثمارًا كبيرًا".
ويعد الدفع للمؤديين الصوتيين جزءًا من معادلة التكلفة، ولهذا، قالت جودي: "يمكن للناشرين تقييم الطلب على الكتب المسموعة من عناوينها قبل الاستثمار فيها".
ويحب الناس الكتب المسموعة، والتي تعد في المرتبة الثانية بعد الموسيقى كمنتج صوتي أكثر شيوعًا. لكن استخدام صوت الذكاء الاصطناعي في الكتب الصوتية يثير ما يمكن وصفه إلى حد ما بأنه شكل خاص من الاستخدام الحميم للتكنولوجيا الجديدة. وقد يمثل ذلك حالة محدودة للمدى الذي يمكن للمستهلكين (والشركات) أن يذهبوا إليه أو سيذهبون إليه - على الأقل في الوقت الحالي - في مبادلة الرواة والمؤديين البشريين بأصوات حاسوبية.
لكن يقول المحللون أن الأداة قد تكون مساعدة لكنها لن تغني العامل البشري، حيث يتوقف الأمر إلى حد كبير على إحساس المستمع بالارتباط بالصوت المنقول إليه من المؤدي. وبالتالي، فليس من السهل الحصول على صوت من الذكاء الاصطناعي، بل والأصعب أن يكون هناك علاقة تواصل مع المستمعين.