<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Arak University of Medical Sciences</title>
<title_fa>مجله دانشگاه علوم پزشكي اراك</title_fa>
<short_title>J Arak Uni Med Sci</short_title>
<subject>Medical Sciences</subject>
<web_url>http://jams.arakmu.ac.ir</web_url>
<journal_hbi_system_id>46</journal_hbi_system_id>
<journal_hbi_system_user>journal46</journal_hbi_system_user>
<journal_id_issn>1735-5338</journal_id_issn>
<journal_id_issn_online>2008-644X</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/jams</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1403</year>
	<month>7</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2024</year>
	<month>10</month>
	<day>1</day>
</pubdate>
<volume>27</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>شناسایی احساسات چند حالته انسانی توسط هوش مصنوعی و کاربرد آن در روانشناسی</title_fa>
	<title>MultiModal Emotional Recognition by Artificial Intelligence and its Application in Psychology</title>
	<subject_fa>روانپزشکی</subject_fa>
	<subject>psychology</subject>
	<content_type_fa>پژوهشي اصیل</content_type_fa>
	<content_type>Original Atricle</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;مقدمه:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; امروزه استفاده از هوش مصنوعی و یادگیری ماشین در تمام علوم، تأثیر گذاشته است. استفاده از آن برای شناسایی احساسات افراد با ادغام داده&#8204;های صوت و متن و تصویر دقت بالاتری را نسبت به سایر روش&#8204;ها نشان می&#8204;دهد و این تشخیص کاربردهای زیادی برای روانشناسان و تعامل ماشین و انسان خواهد داشت. شناسایی احساسات انسان و واکنش افراد یکی از نکات مهم در روانشناسی و روان&#8204;درمانی می&#8204;باشد. شناسایی احساسات تاکنون بصورت فردی و بوسیله بررسی واکنش چهره، نوع سخن گفتن و یا دست&#8204;نوشته&#8204;های اشخاص به محرک&#8204;های و رویدادها شناسایی، بررسی و تجزیه و تحلیل می&#8204;شود. با توجه به شرایط فرد آنالیز شونده و یا شرایط فرد آنالیز&#8204;کننده ممکن است از دقت لازم برخوردار نباشد. این مقاله سعی دارد با توجه به روش&#8204;های هوش مصنوعی و یادگیری ماشین بتواند با دقت بالایی این تشخیص را از داده&#8204;های صوت و متن و تصویر استخراج نماید&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;روش کار:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; این پژوهش از حیث روش از نوع همبستگی بین احساسات و داده&#8204;های ورودی و بر اساس روش&#8204;های یادگیری ماشین و تحلیل رگرسیون برای پیش&#8204;بینی یک متغیر ملاک بر اساس چند متغیر پیش&#8204;بین می&#8204;باشد (متغیر ملاک طبقه احساسی ویژگی&#8204;ها و متغیرهای پیش&#8204;بین صوت و تصویر و متن می&#8204;باشند) جامعه آماری پژوهش مجموعه دادگان &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;IEMOCAP&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; و از حیث نوع داده این پژوهش، آمیخته کمی- کیفی می&#8204;باشد. &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;یافته&#8204;ها:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; نتایج به&#8204;دست&#8204;آمده نشان داد ترکیب اطلاعات صوت و تصویر و متن برای تشخیص احساسات چند حالته انسانی نسبت به تشخیص احساسات از هرکدام از داده&#8204;ها بصورت تنها از دقت بسیار بالاتری برخوردار است.دقت این پژوهش عدد 9/82 را در مجموعه دادگان مبنا نشان می&#8204;دهد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span dir=&quot;LTR&quot; style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;line-height:102%&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;b&gt;&lt;span dir=&quot;RTL&quot; lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:115%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;نتیجه گیری: &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span dir=&quot;RTL&quot; lang=&quot;FA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:115%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;نتایج&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot; lang=&quot;AR-SA&quot; style=&quot;font-size:9.0pt&quot;&gt;&lt;span style=&quot;line-height:115%&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; حاکی از دقت قابل قبول نسبت به تشخیص ادغام داده&#8204;های صوت و متن و تصویر نسبت به هر داده بصورت منفرد در تشخیص احساسات انسانی توسط روش یادگیری ماشین و هوش مصنوعی می&#8204;باشد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;</abstract_fa>
	<abstract>&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;text-justify:kashida&quot;&gt;&lt;span style=&quot;text-kashida:0%&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;Introduction:&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt; Nowadays, the use of artificial intelligence and machine learning has impacted&lt;b&gt; &lt;/b&gt;all fields of study. Utilizing these methods for identifying individuals&amp;#39; emotions through integrating audio, text, and image data has shown higher accuracy than conventional methods, presenting various applications for psychologists and human-machine interaction. Identifying human emotions and individuals&amp;#39; reactions is crucial in psychology and psychotherapy. Emotional identification has traditionally been conducted individually and by analyzing facial expressions, speech patterns, or handwritten responses to stimuli and events. However, depending on the subject&amp;#39;s conditions or the analyst&amp;#39;s circumstances, this approach may lack the required accuracy. This paper aimed to achieve high-precision emotional recognition from audio, text, and image data using artificial intelligence and machine learning methods.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;text-justify:kashida&quot;&gt;&lt;span style=&quot;text-kashida:0%&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;&lt;span style=&quot;letter-spacing:-.1pt&quot;&gt;Methods:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;&lt;span style=&quot;letter-spacing:-.1pt&quot;&gt; This research employs a correlation-based approach between emotions and input data, utilizing machine learning methods and regression analysis to predict a criterion variable based on multiple predictor variables (the emotional category as the criterion variable and the features, audio, image, and text variables as predictors). The statistical population of this study is the IEMOCAP dataset, and the data type of this research is a mixed quantitative-qualitative approach.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;text-justify:kashida&quot;&gt;&lt;span style=&quot;text-kashida:0%&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span calibri=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;Results: &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;The results indicated that combining audio, image, and text data for multi-modal emotional recognition significantly outperformed the recognition of emotions from each data alone, exhibiting a precision of 82.9% in the baseline dataset.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span style=&quot;line-height:115%&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt;Conclusions:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:8.0pt&quot;&gt;&lt;span style=&quot;line-height:115%&quot;&gt;&lt;span ms=&quot;&quot; style=&quot;font-family:&quot; trebuchet=&quot;&quot;&gt; The results demonstrate a considerably acceptable precision in identifying human emotions through audio integration, text, and image data compared to individual data when using machine learning and artificial intelligence methods.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;</abstract>
	<keyword_fa>شناسایی احساسات؛ روانشناسی؛ 
هوش مصنوعی؛ 
احساسات چند حالته؛ 
RNN؛ 
CNN</keyword_fa>
	<keyword>Emotional recognition, 
Psychology, 
Artificial intelligence,
Multimodal emotions, 
RNN, 
CNN</keyword>
	<start_page>194</start_page>
	<end_page>204</end_page>
	<web_url>http://jams.arakmu.ac.ir/browse.php?a_code=A-10-7351-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Seyed Sadegh </first_name>
	<middle_name></middle_name>
	<last_name>Hosseini</last_name>
	<suffix></suffix>
	<first_name_fa>سید صادق</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>حسینی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>sadeghhosseini@malayeru.ac.ir</email>
	<code>4600319475328460090359</code>
	<orcid>4600319475328460090359</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Malayer University, Malayer, Iran</affiliation>
	<affiliation_fa>دانشگاه ملایر، ملایر، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Reza </first_name>
	<middle_name></middle_name>
	<last_name>Yamaghani</last_name>
	<suffix></suffix>
	<first_name_fa>محمد رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>یمقانی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>o_yamaghani@liau.ac.ir</email>
	<code>4600319475328460090360</code>
	<orcid>4600319475328460090360</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Department of Computer Engineering and Information Technology, Lahijan Branch, Islamic Azad University, Lahijan, Iran</affiliation>
	<affiliation_fa>گروه مهندسی کامپیوتر و فناوری اطلاعات، واحدلاهیجان، دانشگاه آزاداسلامی، لاهیجان، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
