Advancements in Generative Artificial Intelligence
Proceedings of 4th ETBS 2024
- 2026
- Buch
- Herausgegeben von
- Nikhil Kumar Marriwala
- Shruti Jain
- P. William
- Dinesh Kumar
- Buchreihe
- Lecture Notes in Networks and Systems
- Verlag
- Springer Nature Singapore
Über dieses Buch
Über dieses Buch
This book includes selected proceedings of the International Conference on “Emerging Technologies in Biomedical Sciences”. The book provides a captivating overview of cutting-edge research and future directions in computational sciences, including signal processing, imaging, computing, instrumentation, and artificial intelligence. By focusing on the latest trends and practical outcomes in research, this book serves as an invaluable resource for professors, researchers, and engineers seeking to deepen their expertise. It aims to empower those dedicated to designing systems that foster societal acceptance of ambient intelligence. Furthermore, the book will be instrumental for researchers striving to advance state-of-the-art healthcare technologies.
Inhaltsverzeichnis
-
Frontmatter
-
Analysis of Various Breakdown Voltage Improvement Techniques for E-mode AlGaN/GaN HEMTs
Ravi Rathour, A. M. KhanDieses Kapitel vertieft die Analyse verschiedener Techniken zur Verbesserung der Durchschlagsspannung von E-Mode AlGaN / GaN-HEMTs, wobei ein besonderer Schwerpunkt auf Geräten mit p-GaN-Gate liegt. Die Diskussion umfasst mehrere Schlüsselbereiche: die Durchbruchmechanismen in diesen Transistoren, verschiedene Verbesserungsansätze wie Gate Engineering, Feldplattentechnologie und Heterostrukturdesign sowie die durch diese Methoden erzielten Leistungsparameter. Das Kapitel beleuchtet auch neuere alternative Ansätze, darunter die Verwendung schrittweise geätzter GaN-Pufferlagen und hybrider Pufferlagen, die vielversprechende Ergebnisse bei der Erhöhung der Durchschlagsspannung gezeigt haben, ohne andere Leistungskennzahlen zu beeinträchtigen. Die Schlussfolgerung unterstreicht die Bedeutung der Konstruktion heterostrukturierter Pufferlagen mit der Umformung von GaN / AlN-Pufferlagen, die die höchste bisher gemeldete Durchschlagsspannung erreicht hat, zusammen mit einer überlegenen Zahl von Vorteilen und einem geringeren spezifischen Durchlasswiderstand. Diese umfassende Analyse bietet wertvolle Einblicke in den aktuellen Zustand und die zukünftige Ausrichtung von E-mode AlGaN / GaN-HEMTs für Hochleistungs- und Hochfrequenzanwendungen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractE-mode HEMTs featuring a p-GaN gate with 2D (2-dimensional) electron gas at the AlGaN/GaN interface demonstrate a substantial density and exceptional mobility of carriers. This characteristic positions them as potential contenders for applications demanding both high frequency and high power. For high-power circuit applications, E-mode HEMTs with high breakdown voltage are desired, which have a significant influence on AlGaN/GaN HEMT performance. From this perspective, even though several approaches for enhancing the breakdown voltage of E-mode HEMTs have been documented in literary works, the most promising approach for advancing circuit integration and device miniaturization in upcoming power electronics systems appears to be the recent approach involving E-mode HEMTs featuring a p-GaN gate with GaN/AlN buffer layer reshaping. This innovative approach has demonstrated a remarkable breakdown voltage of up to 1781 V. The objective of this work is to comprehensively examine and analyze various methodologies designed to elevate the breakdown voltage in high-power E-mode HEMTs featuring a p-GaN gate. Initially, the underlying mechanisms accountable for breakdown are discussed. Subsequently, a concise overview of several approaches aimed at elevating the breakdown voltage in E-mode HEMTs is briefly mentioned. Finally, a novel approach that involves reshaping the hybrid GaN/AlN buffer layer to increase the breakdown voltage in E-mode HEMTs featuring a p-GaN gate is discussed. -
Speech Database Creation for Marathi Impaired Speech
Lata More, Sakshi Paithane, Ajay PaithaneDieses Kapitel untersucht die Erstellung und Bedeutung von Sprachdatenbanken für Marathi-Sprecher mit Beeinträchtigungen, wobei der Schwerpunkt auf dem Stottern liegt. Es geht den Herausforderungen nach, hohe Genauigkeit bei der Spracherkennung zu erreichen, und untersucht die Rolle des maschinellen Lernens und der Verarbeitung natürlicher Sprache bei der Verbesserung dieser Systeme. Der Text diskutiert die Bedeutung von Sprachkorpora bei der Ausbildung und Bewertung von Spracherkennungsalgorithmen und hebt ihre Rolle in verschiedenen Anwendungen wie Diktat, Transkription und Smart-Home-Steuerung hervor. Es bietet auch einen Überblick über bestehende Sprachdatensätze für internationale und indische Sprachen, einschließlich des Marathi-Vokabulars für Behinderte. Das Kapitel schließt mit einer detaillierten Beschreibung der Methodik zur Erstellung des Marathi-Vokabulars für Menschen mit Beeinträchtigungen, einschließlich der Auswahl des Sprechers, der Datenerhebung und der Entwicklung des Sprachkorpus. Der Text betont das Potenzial dieses Korpus, die Kommunikation für Marathi-Sprecher mit Sprachbeeinträchtigungen zu verbessern und zur Entwicklung präziserer und effizienterer Spracherkennungssysteme beizutragen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe development of a corpus for Marathi speech impaired patients is an important step towards improving the accuracy and efficiency of speech recognition systems for population with impaired speech. This project aims to create a comprehensive database of spoken Marathi language samples from individuals with different degrees of speech impairment. The collected audio data will be transcribed and annotated with metadata, such as age, gender, and severity of speech impairment, to facilitate further research on Marathi speech disorders. This corpus can also serve as a valuable resource for developing and evaluating new speech recognition algorithms that are specifically tailored to the needs of Marathi speakers with speech impairments. Ultimately, the creation of this corpus has the potential to improve the quality of life for individuals with speech impairments by enabling better communication tools and technologies. -
Autonomous Mobile Robot with Enhanced Efficiency and Navigation Optimization in Restaurant Environment
Sujit Sonawane, Aniket Jagzap, Mayur Kene, Soham Bhawar, Sidhant KulkarniDieses Kapitel befasst sich mit der Entwicklung und Optimierung eines autonomen mobilen Roboters, der für die Lebensmittellieferung in Restaurants entwickelt wurde. Die Forschung konzentriert sich auf die Verbesserung von Wegeplanungs- und Navigationsstrategien mit fortschrittlichen Technologien wie dem 360 ° -Sensor RPLiDAR A1M8 und der Rechenleistung des Raspberry Pi 4B. Der besondere Zweck des Roboters besteht darin, Lebensmittel nahtlos von der Küche auf die Tische der Gäste zu transportieren und so die einzigartigen Herausforderungen der Restaurantnavigation zu bewältigen. Die Studie integriert Simultaneous Localization and Mapping (SLAM) -Algorithmen und LiDAR-basierte Sensoren, um die Genauigkeit und Präzision der Kartenerstellung zu verbessern. Die Methodik umfasst die Integration von ROS- und SLAM-Algorithmen sowie den Einsatz von Gazebo und Rviz zur Simulation und Visualisierung. Die Ergebnisse unterstreichen die Fähigkeit des Roboters, effizient und sicher in dynamischen Umgebungen zu navigieren, mit einer bemerkenswerten Scangenauigkeit von 90%. In diesem Kapitel werden auch die Vorverarbeitungsmethoden zur Optimierung der Laserdaten und deren Auswirkungen auf die Leistung des Roboters diskutiert. Insgesamt bietet diese Forschung einen umfassenden Überblick über die Entwicklung und Erprobung eines autonomen mobilen Roboters für die Lebensmittellieferung und bietet Einblicke in die Zukunft autonomer Systeme im Gastgewerbe.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe present research focuses on developing and optimizing path-planning strategies for an Autonomous Mobile Robot (AMR) for food delivery in restaurant environments. Utilizing the RPLiDAR, A1M8 360° sensor, and the computational power of the Raspberry-Pi 4B by designing SLAM algorithms that allow the robot to navigate dynamically in restaurant spaces, ensuring efficient delivery routes while considering safety margins, time efficiency, and energy consumption. The unique application of this robot lies in its purpose to serve as an autonomous food delivery system, seamlessly transporting dishes from the restaurant kitchen to customers’ tables. Integrating classical optimization techniques, heuristic approaches, and machine learning algorithms, the research addresses the specific challenges of restaurant navigation and aims to enhance the adaptability and autonomy of the robot. Rigorous testing in simulated and real-world restaurant scenarios will validate the algorithm’s performance, contributing valuable insights to autonomous robotic systems in the context of restaurant service applications. -
Recognition System for Discrete Facial Emotions Using Convolutional Neural Networks-CNN
Amit S. Ufade, Vitthal J. GondDieses Kapitel taucht ein in die faszinierende Welt der Gesichtserkennung mittels konvolutionaler neuronaler Netzwerke (CNNs). Es beginnt mit der Einführung des Konzepts der Gesichtserkennung und ihrer Bedeutung für die Mensch-Maschine-Interaktion. Anschließend werden die Herausforderungen in diesem Bereich untersucht, einschließlich der Beschränkungen aktueller Modelle und der Notwendigkeit zuverlässigerer und robusterer Systeme. Die Autoren schlagen ein CNN-basiertes Modell vor, das diskrete Gesichtsemotionen wie Glück, Traurigkeit, Wut und Neutralität mit hoher Genauigkeit erkennen kann. Das Modell wird auf verschiedenen Datensätzen trainiert, darunter FER-archive-6, CK + 48, CFEE, JAFEE und FACES, und seine Leistung wird anhand von Verwirrungsmatrizen bewertet. In diesem Kapitel wird auch die Verwendung multimodaler Daten wie EEG- und EKG-Signale diskutiert, um die Zuverlässigkeit des Modells zu verbessern. Die Ergebnisse zeigen, dass das vorgeschlagene Modell eine hohe Genauigkeit bei der Klassifizierung von Emotionen erreichen kann, was es zu einem wertvollen Werkzeug für Anwendungen in den Bereichen Gesundheit, Bildung und Technologie macht. Das Kapitel schließt mit der Hervorhebung des Potenzials der Gesichtserkennung zur Verbesserung der Mensch-Maschine-Interaktion und der Notwendigkeit weiterer Forschung auf diesem Gebiet.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractEmotion recognition is an interesting and challenging area under affective computing domain. Emotion plays and interesting role in human life, in fact most of our decisions are also influenced by our emotion at that particular instance in life. This paper explores the use of single modality i.e. using facial expression can significantly contribute to the task of emotion recognition. Convolutional neural network (CNN) an algorithm of deep learning we have used to extract facial features and use these futures for finding out discrete state emotions. Further fine tuning convolutional neural network i.e. by changing parameters and hyper parameters we have experimented facial emotion recognition task in hand on different dataset available publicly. The results obtain during experimentation varies from as low as 45% to 100% accurate, it is important to note that singly modality, number of images, precautions taken during emotion capturing number of classes of emotion, continuous of discrete emotion classification, age & gender of participants play significant role apart from Number of layers, filter size, activation function, and another hyper-parameter of CNN. -
Predicting Capsicum Leaf Diseases Using Machine Learning Technique
Prashant B. Vikhe, Baisa L. GunjalDieses Kapitel befasst sich mit der Anwendung maschineller Lerntechniken zur Vorhersage und Identifizierung von Capsicum-Blattkrankheiten, einer kritischen Herausforderung in der Landwirtschaft. Die Studie unterstreicht die wirtschaftliche Bedeutung von Capsicum-Pflanzen und die Notwendigkeit, Krankheiten rechtzeitig zu erkennen, um optimale Ernteerträge zu gewährleisten. Es stellt einen neuartigen Ansatz dar, der konvolutionale neuronale Netzwerke (CNNs) zur Analyse von Blattbildern und zur präzisen Diagnose von Krankheiten einsetzt. Die Forschung umfasst die Sammlung eines vielfältigen Datensatzes mit 3.100 Echtzeitbildern aus verschiedenen Anbaugebieten, die von Fachleuten der Agrarindustrie kommentiert und verifiziert wurden. Der Datensatz umfasst Bilder, die unter unterschiedlichen Lichtverhältnissen und Winkeln aufgenommen wurden, was die Robustheit des Modells in realen Anwendungen gewährleistet. Die Studie diskutiert auch die Schritte der Datenvorverarbeitung, einschließlich Datenbereinigung, Integration, Transformation und Reduktion, um die Bilder für die Analyse vorzubereiten. Das vorgeschlagene System erreicht eine beeindruckende Genauigkeit von 96,83% bei der Diagnose von Capsicum-Krankheiten und demonstriert damit sein Potenzial, die Erkennung von Krankheiten in der Landwirtschaft zu revolutionieren. Durch die Integration dieser Technologie können Landwirte und landwirtschaftliche Fachkräfte zeitnahe Präventivmaßnahmen umsetzen, die letztlich die Produktivität der Pflanzen und die Pflanzengesundheit verbessern.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractMachine learning, particularly with convolutional neural networks (CNNs), has demonstrated significant success in classifying various plant diseases. This proposal offers a summary and analysis of current methodologies for detecting capsicum leaf diseases. The investigation employed several simulation techniques for neurons and layers, utilizing a CNN trained on a dataset comprising images of capsicum plants. The decline in both quantity and quality of agricultural products can be attributed to foliar diseases, resulting in substantial financial losses. Robust plant health and dependable disease detection data can facilitate effective disease control, thereby boosting agricultural production. Given the importance of managing insect populations, particularly concerning capsicum plants, swift action is necessary to address issues such as viruses or wilt, which can devastate gardens. Prompt removal of diseased plants is advisable to prevent further spread among neighboring plants. Convolutional networks have the capability to learn features from larger datasets, mitigating concerns about image quality. Real-time data from 3,100 leaf images can achieve an average accuracy of 96.83% in identifying capsicum diseases. -
Machine Learning-Based Dos Attack Detection Technique for Smart Grid Infrastructure
Kamalesh Thoppaen Suresh Babu, Mital Patel, Rupali Attarde, R. Mohan KumarDieses Kapitel vertieft die kritische Frage der Cybersicherheit in der Smart-Grid-Infrastruktur und konzentriert sich auf die Erkennung und Eindämmung von Denial-of-Service (DoS) -Angriffen. Die Studie stellt einen neuartigen Ansatz vor, der die Krillherdenoptimierung (KHO) mit der Twin Support Vector Machine (TSVM) kombiniert, um ein robustes Nachweissystem zu schaffen. Im Abschnitt Methodik wird die Verwendung des KDD Cup '99-Datensatzes und die Entwicklung eines Smart Grid DoS-Intrusion-Detection-Verfahrens skizziert. Im Ergebnisteil wird eine umfassende Evaluierung der vorgeschlagenen Technik präsentiert und ihre Leistungsfähigkeit mit bestehenden Methoden wie SVM, LR und NB verglichen. Schlüsselkennzahlen wie Genauigkeit, Präzision, Rückruf und F1-Score werden analysiert, um die Überlegenheit des KH-TSVM-Ansatzes zu demonstrieren. Die Schlussfolgerung unterstreicht das Potenzial der vorgeschlagenen Methode zur Verbesserung der Sicherheit intelligenter Netzinfrastruktur gegen sich entwickelnde Cyber-Bedrohungen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIn the field of electrical power distribution, a paradigm change has occurred with the development of conventional power grids into complex, intelligent systems known as Smart Grids. Cyberattack susceptibility is a major problem for smart grid systems. Our suggested method Krill Herd assisted Twin Support vector machine (KH-TSVM) requires the installation of strong cybersecurity safeguards to overcome this drawback. We started by gathering a KDD Cup'99 dataset. KDD'99 is a larger data set, including 4,898,430 records. The suggested technique, KH-TSVM, improves the precision and effectiveness of DoS attack detection systems by fusing the benefits of twin support vector machines with krill herd optimization. The goal of the KH-TSVM framework is to enhance the TSVM's generalization and classification skills by optimizing its hyperparameters using the KH algorithm. According to precision (82.49%), recall (83.89%), accuracy (85.48%) and F1-score (85.95%), the model that is suggested works better. According to these results, there is potential for the KH-TSVM strategy to strengthen Smart Grid Infrastructure security against changing cyber threats. -
Automatic Stability Studies Alert System for Pharmaceutical Formulations
Madhur Kulkarni, Poorna Shankar, Soumitra Das, Chetan Sul, Shubhankar BarhateDieses Kapitel untersucht die Entwicklung und Implementierung eines automatischen Stabilitätsstudien-Warnsystems für pharmazeutische Formulierungen, wobei der Schwerpunkt auf den Herausforderungen der Verwaltung von Stabilitätsdaten und der Notwendigkeit rechtzeitiger Warnungen liegt. Das System nutzt Python-Bibliotheken wie Sellerie- und Cron-Jobs, um Stabilitätsparameter autonom auszuwerten und Alarme auf Grundlage vordefinierter Kriterien zu setzen. Schlüsselthemen sind die Bedeutung von Stabilitätstests für die Gewährleistung von Produktqualität und -sicherheit, die Rolle moderner Datenanalyse in Warnsystemen und die Integration benutzerfreundlicher Schnittstellen für eine effektive Kommunikation. Das Kapitel behandelt auch die Architektur des Systems, einschließlich sicherer Benutzerauthentifizierung, Formulierungsdetails-Management und automatisierter Alarmgenerierung. Die Ergebnisse zeigen die Effizienz des Systems bei der rechtzeitigen Alarmierung und der Verbesserung der Entscheidungsprozesse in pharmazeutischen Stabilitätsstudien. Die Schlussfolgerung unterstreicht das Potenzial zukünftiger Arbeit, einschließlich der Integration von Stabilitätsprognosemodellen und Echtzeit-Überwachungsfunktionen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractPharmaceutical formulations undergo extensive stability studies to ensure their efficacy and safety over time. However, managing timely withdrawal of stability samples and their evaluation for promptly addressing potential issues pose significant challenges in decision-making and quality control processes. To mitigate these challenges, this project presents an Automatic Stability Studies Alert System and Visual Analytics platform.Employing advanced data analytics techniques and utilizing Python libraries like Celery and cron jobs, the system focuses on analyzing stability data from pharmaceutical formulations to set alerts. This proactive approach ensures stakeholders receive timely alerts to withdraw samples of formulations subjected to various storage conditions, enhancing the efficiency and effectiveness of stability monitoring processes. This project features a user-friendly visual analytics interface equipped with interactive tools for timely withdrawal and evaluation of stability of pharmaceuticals, followed by exploring and interpreting the data, so that the users can effortlessly visualize trends, product alert schedules enabling deeper insights into formulation stability and facilitating informed decision-making. Key functionalities in this research work encompass seamless data integration from data source, customizable + alert thresholds, sending auto email and SMS reminders and dynamic visualization capabilities. By enhancing efficiency, accuracy, and transparency in pharmaceutical stability studies, the system strives to elevate product quality and ensure regulatory compliance in the pharmaceutical industry. -
AI-Driven Plant Health Diagnostics
Abhay Chopde, Roshan Thorat, Om Uikey, Mayur TidakeDas Kapitel untersucht die Integration von künstlicher Intelligenz und maschinellem Lernen in die Pflanzengesundheitsdiagnostik, wobei der Schwerpunkt auf dem KI-Powered Plant Health Advisor Projekt liegt. Zu den Schlüsselthemen zählen der Einsatz konvolutionaler neuronaler Netzwerke (CNNs) zur Identifizierung von Arten und zur Erkennung von Krankheiten, die Schaffung einer soliden Wissensbasis für Behandlungsempfehlungen und die Entwicklung einer benutzerfreundlichen Schnittstelle für eine nahtlose Interaktion. Die Methodik des Projekts umfasst die Erhebung von Daten aus verschiedenen Datensätzen, die rigorose Vorverarbeitung und den Modellbau mit CNNs. Die Ergebnisse zeigen eine hohe Genauigkeit bei der Klassifizierung von Krankheiten und das Potenzial für frühzeitige Interventionen. Das Kapitel unterstreicht auch die Bedeutung der Datensicherheit und die umfassenderen Auswirkungen auf die Nachhaltigkeit der Landwirtschaft und die Netzwerksicherheit. Dieser umfassende Ansatz bietet einen detaillierten Überblick darüber, wie künstliche Intelligenz die Pflanzenpflege und das Krankheitsmanagement revolutionieren kann, und liefert wertvolle Erkenntnisse für Fachleute auf diesem Gebiet.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe AI-Powered Plant Health Advisor project leverages AI and machine learning to create a comprehensive system for plant care. It involves building models for detecting diseases in plants using annotated image datasets. These models integrate with a knowledge base for treatment recommendations based on identified diseases. The system also offers tailored plant care advice by recognizing plant species and providing relevant care information. Its user-friendly interface allows easy image uploads for comprehensive analysis, aiming to empower users in understanding and nurturing their plants for optimal health. -
CST-YOLO7 to Enhanced Models for Detecting Soybean Diseases: A Statistical Analysis with CNN-SWIN Transformer and Backbone Architecture
Prajkta P. Khaire, Ramesh D. Shelke, Dilendra HiranDieses Kapitel befasst sich mit der Integration von CNN-SWIN Transformer und Backbone Architecture in das CST-YOLO7-Modell und konzentriert sich auf seine Anwendung bei der Erkennung von Sojabohnenkrankheiten. Es bietet eine umfassende statistische Analyse, in der Schlüsselkennzahlen wie Präzision, Abruf, F1-Wert, mittlere Durchschnittspräzision (mAp), falsch positive Rate (FPR), falsch negative Rate (FNR), Genauigkeit und Infolgezeit ausgewertet werden. Das Kapitel vergleicht auch die Wirksamkeit des CST-YOLO7-Modells mit herkömmlichen Ansätzen und hebt seine überlegene Leistung hervor. Darüber hinaus wird die Bedeutung der Erkennung von Sojabohnenkrankheiten für die Nachhaltigkeit der Landwirtschaft und die Ernährungssicherheit diskutiert und das Potenzial des Modells für Anwendungen in der realen Welt hervorgehoben. Das Kapitel schließt mit Empfehlungen für die zukünftige Forschung und Verbesserungen bei der automatischen Erkennung landwirtschaftlicher Krankheiten.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractSoybean diseases pose major challenges to global agricultural sustainability and food security. In this study, we conduct a comprehensive statistical analysis to compare the effectiveness of Improved YOLO Algorithm, an advanced soybean disease detection model, with other advanced models. We emphasize the integration of the CNN-SWIN transformer and backbone architecture to expand the detection capabilities. We focused on how well Improved YOLO Algorithm works when we added a special technology called CNN-SWIN Transformer and Backbone Architecture to improve it. Using a diverse dataset that includes images of soybean plants, we rigorously evaluate the performance of improved YOLO Algorithm and protracted representations in terms of precision, recall, and F1 score. Our investigation sheds light on the effectiveness of Improved YOLO Algorithm compared to other models in accurately identifying soybean diseases. In addition, we study the influence of the CNN-SWIN transformer and backbone architecture on the detection accuracy and efficiency. Our results highlight the superior performance of Improved YOLO Algorithm, especially when combined with CNN-SWIN Transformer and Backbone Architecture. Our research underwrites to the improvement of soybean disease recognition methods and provides insights essential for precision agriculture and disease management. The implications of our findings extend to improving crop yields and ensuring food security in soy-growing regions. Our study also helps farmers identify when their soybeans are diseased so they can address the problem early. This can help grow more food for everyone and ensure there is enough to eat. -
Real-Time Sign Language Recognition Using Deep Learning Algorithms LSTM Neural Networks and MediaPipe Holistic
Shrishail Patil, Ritesh Sah, Mrunali Rajkule, Akshada Bagul, Swaliha AttarDieses Kapitel geht den Herausforderungen und Fortschritten bei der Zeichensprachenerkennung (SLR) nach und konzentriert sich auf die Echtzeiterkennung mittels Deep-Learning-Algorithmen. Die Studie beleuchtet die Grenzen aktueller Computervision und sensorbasierter Ansätze wie domänenübergreifende Erkennungsprobleme und die Abhängigkeit von festen Geräten. Die Autoren schlagen eine neuartige Lösung vor, die neuronale Netzwerke des LSTM und MediaPipe Holistic nutzt, die Schlüsselpunkte aus der Hand, dem Gesicht und der Pose extrahieren, um Gesten der Zeichensprache präzise zu erkennen. Die Methodik beinhaltet die Ausbildung eines tiefen neuronalen Netzwerks mit LSTM-Schichten und dichten Schichten, wodurch selbst bei begrenzten Daten beeindruckende Genauigkeitsniveaus erreicht werden. Die Studie untersucht auch verschiedene SLR-Modelle und diskutiert ihre Techniken, Datenproben, Zeichenarten und Genauigkeitsniveaus. Die Ergebnisse zeigen, dass das vorgeschlagene Modell eine hohe Genauigkeit bei der Zeichensprachenerkennung in Echtzeit erreichen kann und damit zentrale Herausforderungen in diesem Bereich angeht. Diese Forschung trägt zur Weiterentwicklung von SLR-Systemen bei und bietet eine praktische Lösung für Anwendungen in der realen Welt.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe presented research paper presents a thorough study and enhancement of Sign Language Recognition Systems (SLRS) using Artificial Intelligence (AI) and Machine Learning techniques. Sign language is an important part in communication for the Deaf and mute community, however existing systems face difficulties with accuracy and accessibility. Our study introduces an innovative approach to enhance the effectiveness and efficacy of sign language gesture detection by using neural networks with LSTM and Dense Layers concepts. The proposed system shows significant advancements, including hyper-accuracy, faster training times, and a simplified architecture compared to traditional deep neural network models. These improvements solve essential communication barriers for the Deaf and mute community, offering promising solutions for sign language recognition in real-time. -
Revolutionizing Industrial IoT: An Innovative Machine Learning Framework for Intelligent Signal Classification in Distributed Wireless Sensor Networks
Rakesh Thoppaen Suresh Babu, Kamalesh Thoppaen Suresh Babu, P.S.Kumaresh, R. Mohan KumarDieses Kapitel untersucht das transformative Potenzial eines innovativen Frameworks für maschinelles Lernen, das für die intelligente Signalklassifizierung in verteilten drahtlosen Sensornetzwerken innerhalb des Industrial Internet of Things (IIoT) konzipiert wurde. Die Studie unterstreicht die wachsende Bedeutung von IoT-Anwendungen und die entscheidende Rolle von Datensicherheit und Echtzeitverarbeitung im industriellen Umfeld. Sie adressiert die Herausforderungen komplexer betrieblicher Umstände und diversifizierter Datenübertragung in IIoT-Umgebungen und betont die Notwendigkeit einer effizienten und logischen Verwaltung von Echtzeitdaten. Das vorgeschlagene Rahmenwerk, AM-SDCNN, wurde sorgfältig konzipiert, um Modulationsprogramme in Echtzeit basierend auf Kanalzuständen anzupassen, die Flexibilität zu erhöhen und den Signalaufwand zu verringern. Das Kapitel bietet eine umfassende Analyse verschiedener Modulationsschemata, einschließlich BPSK, QPSK und AM, und bewertet ihre Leistung anhand von Simulationen. Die Ergebnisse belegen die überlegene Genauigkeit und Effizienz der AM-SDCNN-Methode, die unter optimalen Bedingungen eine Klassifizierungsrate von über 92% erreicht. Dieser innovative Ansatz verbessert nicht nur die Signalklassifizierung, sondern trägt auch zur Entwicklung robusterer und anpassungsfähigerer IIoT-Netzwerke bei und ebnet den Weg für zukünftige Fortschritte in der industriellen Automatisierungs- und Kommunikationstechnologie.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe various industrial sectors stand to gain significant advantages from the implementation of the Industrial Internet of Things (IIoT). Furthermore, given restricted channel materials, it is challenging to make the globe’s most effective choice in distributed wireless sensor networks (DWSN). Industrial sensor networks are susceptible to complicated industrial circumstances which are susceptible to an integration of various signal patterns. The complex interference from multiple signals can significantly lower the effectiveness of the classification of signals on industrial equipment, requiring a significant process of training that characteristics can be obtained. Furthermore, generalized envelope squared spectrum (GESS) is supplied for increased reconstruction of transmission signals. In this study, we propose a machine learning-based model an adaptive modulation-based simplified deep convolutional neural network (AM-SDCNN) for classifying signal nodes DWSN. Frequency reduction and sampling conditioning are implemented to receive signals from nodes, enabling the generation of intelligent signal representations. The aggregation center gets the output of the signal categorization process carried out by every single sensor node over a network. The simulation demonstrates that the suggested AM-SDCNN technique has beneficial performance in signal classification. Particularly, the suggested technique does not need transmitting signals from nodes to the aggregation center, which can preserve the privacy of industrial information. -
Innovative Practices for Detecting Infections in X-Ray Images Using AI-Based Techniques
Rahulsingh G. Bisen, Archana M. Rajurkar, Nikita S. PandeDieses Kapitel befasst sich mit innovativen Methoden zur Erkennung von Infektionen in Röntgenbildern mittels KI-basierter Techniken, wobei der Schwerpunkt auf Tuberkulose und Lungenentzündung liegt. Darin werden die Herausforderungen bei der Diagnose dieser Infektionen untersucht, darunter der Mangel an Standardisierung bei der Interpretation, die begrenzte Sensitivität und Spezifität von Röntgenstrahlen und die Notwendigkeit hochauflösender Bilder. Der Text beschreibt verschiedene Datensätze, die für die Ausbildung von KI-Modellen verwendet werden, wie den Montgomery County Röntgendatensatz, den Chest X-ray14 Datensatz und den Shenzhen Datensatz, wobei ihre Stärken und Grenzen hervorgehoben werden. Außerdem werden traditionelle Techniken des maschinellen Lernens wie SVM und Random Forest sowie Deep-Learning-Modelle wie CNN, U-Net und Co-CNN überprüft und ihre Leistungskennzahlen verglichen. Das Kapitel schließt mit der Betonung des Potenzials künstlicher Intelligenz bei der Verbesserung der Genauigkeit und Effizienz der Infektionsdiagnose, während gleichzeitig die Herausforderungen und zukünftigen Richtungen in diesem Bereich angesprochen werden. Die Leser erhalten Einblicke in die neuesten Fortschritte in der KI-basierten bildgebenden Diagnostik und ihre Auswirkungen auf die globale Gesundheit.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThis review article delves into the prevalent global health threats posed by respiratory infections, particularly Tuberculosis (TB) and pneumonia, which significantly impact morbidity and mortality rates worldwide. The paper underscores the crucial role of medical imaging, specifically X-rays, in the detection and diagnosis of these infections, even in resource-limited settings. It addresses various challenges in accurately interpreting X-ray images, including the lack of standardization and the need for high-resolution imaging, and explores how modern digital X-rays can bridge some of these gaps. The article further investigates the burgeoning field of Artificial Intelligence (AI), highlighting its potential to enhance diagnostic accuracy through machine learning and deep learning techniques. By examining different datasets and AI methodologies, this review demonstrates AI's capability to improve the speed and accuracy of diagnosing TB and pneumonia, thereby potentially reducing the global health burden caused by these diseases. -
Study on Potential of A.I. in Agriculture Sector in Indian Context: Opportunities and Challenges
Pooja S. Kawle, Dipashri H. Pawar, Sakshi S. Gadhave, Naid A. Daruwale, Ritesh PatelDieses Kapitel untersucht das Potenzial künstlicher Intelligenz (KI), die indische Landwirtschaft zu revolutionieren, und konzentriert sich dabei auf Pflanzenmanagement, Präzisionslandwirtschaft, Marktintelligenz und Entscheidungsunterstützungssysteme. Sie zeigt auf, wie KI die Produktivität steigern, die Ressourcennutzung optimieren und die Marktprognosen verbessern kann. Der Text diskutiert auch die Herausforderungen der Einführung künstlicher Intelligenz, wie Datenschutz, technologische Zugänglichkeit und die Notwendigkeit maßgeschneiderter Lösungen. Durch detaillierte Fallstudien und statistische Daten unterstreicht sie die transformativen Auswirkungen künstlicher Intelligenz auf die indische Landwirtschaft und bietet praktische Empfehlungen für Politiker, Forscher und Landwirte, das Potenzial künstlicher Intelligenz effektiv zu nutzen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe integration of artificial intelligence (AI) holds immense promise for revolutionizing agricultural practices in India, a nation where the agriculture sector plays a pivotal role in the economy and sustains millions of livelihoods. This paper examines the potential and challenges of implementing AI in Indian farming practices to address pressing issues such as climate change, water scarcity, and population pressure. Drawing from a comprehensive literature review and statistical data, it explores various AI applications in crop management, precision farming, agriculture robotics, market intelligence, and decision support systems. The analysis reveals a landscape ripe with opportunities for AI to enhance productivity, efficiency, and sustainability in Indian agriculture. However, challenges such as technological accessibility, data privacy concerns, and socioeconomic constraints hinder widespread adoption. Recommendations are provided to overcome these challenges, including the establishment of supportive infrastructure, promoting data sharing and standardization, investing in research and development, fostering collaboration, providing training and skill development, establishing regulatory frameworks, offering financial support and incentives, creating awareness and outreach programs, and implementing AI test beds and pilot projects. By addressing these challenges and leveraging AI innovations tailored to the Indian context, the agricultural sector can realize its potential for transformation, contributing to food security, economic growth, and environmental sustainability. -
Revolutionizing Stroke Prediction Framework: A Deep Learning Approach Using Real-Time EEG Data
Venkat Namdev Ghodke, A. K. M. B. Hossain, Rakesh Thoppaen Suresh Babu, R. Mohan KumarDieses Kapitel untersucht die Entwicklung eines bahnbrechenden Rahmenwerks zur Schlaganfallvorhersage unter Verwendung von Deep-Learning-Techniken und Echtzeit-EEG-Daten. Die Studie betont die entscheidende Rolle einer präzisen Schlaganfallvorhersage bei der Vermeidung schwerer Gesundheitsrisiken und der Verbesserung der Patientenergebnisse. Die vorgeschlagene Methodik umfasst die Datenerfassung aus EEG-Signalen, die Vorverarbeitung mittels Min-Max-Normalisierung, die Featureextraktion mit diskreten Wellentransformationen und die Implementierung eines multifunktionalen adaptiven konvolutionalen neuronalen Netzwerks (EBCI-MACNN). Die Ergebnisse zeigen, dass das EBCI-MACNN-Framework hohe Genauigkeit, Präzision, F1-Score und Spezifität erreicht und damit bestehende Methoden wie CNN-Bidirektionales LSTM, PSO-LSTM und HDTL-SRP übertrifft. In diesem Kapitel wird auch das Potenzial der Integration fortgeschrittener maschineller Lerntechniken diskutiert, um die Leistung des Vorhersagemodells weiter zu verbessern. Durch die Nutzung von Echtzeitdaten und hochentwickelten Algorithmen bietet dieses Rahmenwerk einen vielversprechenden Ansatz zur Schlaganfallfrüherkennung und personalisierten Gesundheitsmaßnahmen.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractA stroke has the potential fatal if neglected among teenagers and older people are more likely to suffer from stroke disability that could result in a variety of societal and financial challenges. It is shown that individuals who have a stroke display aberrant biological signals. A stroke demands quick action which takes more time to identify and address a condition that might hurt an individual's prognosis. To overcome this issue, we have proposed the Ensemble Bee Colony intelligence multi-featured adaptive convolutional neural network (EBCI-MACNN) to predict stroke illness. In this paper, we have used a wide range of health-related information including illnesses and environmental characteristics. We collected the electroencephalogram (EEG) dataset and preprocessed using min-max normalization and then feature extracted through a discrete wavelet transform (DWT). Stroke can be affected and deadly for older people as they have less immune power in their bodies. These novel strategies were able to provide quick and more reliable stroke alerts that would enable preventive medical measures. The proposed method obtained 96% of accuracy, 98% of precision, 95% of F1 score, and 96% of specificity. -
Deep Surveillance: Advancing Video Monitoring with Deep Learning
Vikas Chavan, Ashok Badade, Gaurav Badgujar, Vaibhav Deshmukh, Rutik DhamaneDas Kapitel untersucht die transformativen Auswirkungen von Deep Learning auf die Videoüberwachung und konzentriert sich auf Schlüsselelemente wie Objekterkennung, Verhaltensanalyse und Anomalieerkennung. Es untersucht die Architektur und algorithmische Auswahl von Deep-Learning-Modellen und beleuchtet ihren praktischen Einsatz in ressourcenbeschränkten Umgebungen. Die Forschung zeigt signifikante Verbesserungen bei der Erkennungsgenauigkeit und Echtzeit-Warnungen durch umfangreiche Experimente in verschiedenen Szenarien. Darüber hinaus unterstreicht das Projekt die potenzielle Anwendbarkeit und Skalierbarkeit des vorgeschlagenen tief greifenden Überwachungssystems in verschiedenen Bereichen, einschließlich intelligenter Städte, des Schutzes kritischer Infrastruktur und von Einzelhandelsanalysen. Ethische Erwägungen wie die Wahrung der Privatsphäre und Einverständnisprotokolle der Nutzer werden ebenfalls berücksichtigt, um die Einhaltung von Vorschriften und die Achtung der Rechte des Einzelnen zu gewährleisten. Das Kapitel schließt, indem es den Weg für zukünftige Fortschritte bei der Tiefenüberwachung ebnet und die Bedeutung interdisziplinärer Zusammenarbeit und der Integration modernster Technologien betont.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIn a rapidly evolving world where security and surveillance play pivotal roles in public safety, urban planning, and industrial operations, the integration of deep learning technologies has emerged as a groundbreaking solution to enhance video surveillance systems. This research paper presents a comprehensive investigation and implementation of the “Deep Surveillance with Deep Learning – Intelligent Video Surveillance Project. “Using deep learning algorithms to transform traditional video surveillance and enable intelligent, real-time video data monitoring and analysis is the project's main goal. Our study uses state-of-the-art deep learning methods, such as object detection models, recurrent neural networks (RNNs), and convolutional neural networks (CNNs), to extract and analyze pertinent data from video feeds. By focusing on key aspects such as object recognition, behavior analysis, and anomaly detection, we empower surveillance systems to provide instantaneous insights and proactive security measures. The utilization of transfer learning, data augmentation, and model optimization strategies ensures the robustness and adaptability of the system. The paper delves into the architectural design, algorithm selection, and practical deployment of deep learning models within resource constrained surveillance environments. Extensive experimentation is conducted across a range of scenarios, encompassing daytime and nighttime surveillance, crowded scenes, and the identification of suspicious activities. The results showcase substantial improvements in detection accuracy, real-time alerts, and overall surveillance system performance. Furthermore, the research paper outlines the potential applications and scalability of the proposed deep surveillance system, offering insights into its benefits for a variety of use cases, such as smart cities, critical infrastructure protection, and retail analytics. -
Ethanol-Powered Vehicles: Advancements in Flex-Fuel Technology and Supply Chain Integration
Yashraj Pravin Desale, Priya Rakibe, Rimzim Chark, Jai ShahDieses Kapitel vertieft die Fortschritte bei ethanolbetriebenen Fahrzeugen, wobei der Schwerpunkt auf der Flex-Fuel-Technologie und der Integration der Lieferkette liegt. Es beleuchtet die weltweit führenden Hersteller von Ethanol wie die USA und Brasilien und untersucht Indiens ehrgeizige Ziele für die Ethanolmischung in Benzin. Der Text diskutiert den historischen Kontext von Fahrzeugen auf Ethanolbasis, den Nutzen für die Umwelt und die wirtschaftlichen Auswirkungen auf Landwirte und ländliche Entwicklung. Sie befasst sich auch mit den Herausforderungen in den Bereichen Verdampfung, Destillationskapazität, Fahrzeugkompatibilität und Kraftstoffinfrastruktur. Das Kapitel schließt mit einem Vorschlag für einen vielschichtigen Ansatz zur Überwindung dieser Herausforderungen, wobei der Schwerpunkt auf Forschung und Entwicklung, Politik und Anreize, Infrastrukturentwicklung, Verbraucherbildung und einer schrittweisen Einführung liegt. Darüber hinaus umfasst sie die Integration der Lieferkette der Ethanolproduktion, die Verbindung von Landwirten mit Ethanolfabriken und schlägt Initiativen wie EthoBoost vor, um Frauen zu stärken und umweltbewusste Entscheidungen zu fördern. Das Kapitel steht im Einklang mit den Zielen nachhaltiger Entwicklung, die darauf abzielen, Ungleichheit zu verringern, erschwingliche und nachhaltige Energie sicherzustellen, Wirtschaftswachstum zu fördern, den Klimawandel zu bekämpfen und globale Partnerschaften zu fördern.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe escalating global population has driven an increase in vehicle numbers, raising fuel demand and environmental concerns [8]. To address this, there is growing interest in alternative fuels like ethanol, derived from plant sugars such as sugarcane, corn, and wheat [6]. Ethanol is lauded for its renewable nature, cost-effectiveness, and clean-burning characteristics, which help reduce vehicle emissions [12]. In India, ethanol production not only benefits the environment but also boosts employment and supports agricultural growth.Recent milestones include the unveiling of the world's first BS-VI Stage II Electrified Flex Fuel Vehicle and the launch of the Global Biofuel Alliance during the G20 summit, showcasing international collaboration in biofuel innovation [1].The paper examines the historical context of ethanol-based vehicles, global ethanol production trends, India's growing ethanol sector, production techniques, and challenges associated with flex-fuel vehicles. It also proposes a supply chain model aimed at optimizing ethanol production by ensuring a consistent supply of raw materials, benefiting both farmers and industrialists. This model aligns with Sustainable Development Goals (SDGs) by promoting sustainable energy sources, supporting economic growth, and advancing climate action through the adoption of ethanol as a renewable fuel. Ultimately, this supply chain model is crucial for advancing sustainable development objectives and fostering a brighter future for all stakeholders involved. -
Rotating Binaural Hearing System Probable Future in 3D Sound Source Localization
Vipin Vibhute, Yogesh Angal, B. SurykanthDieses Kapitel untersucht die Fähigkeit des menschlichen Gehörsystems, Schall in drei Dimensionen zu lokalisieren, wobei der Schwerpunkt auf dem innovativen Einsatz eines rotierenden binauralen Hörsystems liegt, das von Schleiereulen inspiriert ist. Die Forschung untersucht die entscheidende Rolle der Kopfdrehung bei der Lokalisierung von 3D-Schallquellen und stützt sich dabei auf verschiedene Studien über Hör- und Schallortungstechniken für Eulen. Das Kapitel stellt zwei neue Ansätze vor: Der erste beinhaltet die asymmetrische Positionierung des rechten Ohrmikrofons, um die Position des Schleiereule-Ohrs zu imitieren, während der zweite beinhaltet, ein einzelnes Mikrofon in vier 90 ° -Schritten zu drehen, um Mehrdeutigkeiten bei der Lokalisierung der Schallquelle zu beheben. Der Versuchsaufbau umfasst einen Roboterkopf, der mit zwei Mikrofonen ausgestattet ist, wobei das rechte Mikrofon ähnlich wie bei Schleiereulen höher als das linke positioniert ist. Die Ergebnisse zeigen das Potenzial dieser Ansätze, den Oktans zu identifizieren, in dem sich eine Schallquelle befindet, sogar innerhalb der Verwirrungs- und Verwirrungsebene. Das Kapitel schließt mit einer Diskussion über die Notwendigkeit weiterer Forschung zur sofortigen Lokalisierung von Schallquellen und die möglichen Anwendungen dieser Erkenntnisse in der Robotik und Akustik.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractA rotating binaural hearing system is capable of estimating a sound source's instantaneous direction in three dimensions. Interaural Time Delays at the hearing points and an angled binaural hearing system are combined to create this system. The intended work uses the direction of a sound source in three dimensions by drawing inspiration from the hearing mechanism of a barn owl. A three-dimensional (3D) space surrounding a robot head has been divided into eight octants. Two microphones have been used in each of these octants, and two novel approaches have been employed to locate the source of sound. One approach involves positioning one microphone at a higher angle than the other. In approach two, the microphone positioned at a higher angle is rotated in four steps of 90° counterclockwise in an effort to reduce the uncertainty caused by approach one. Even though the current research is able to identify the sound source within the eight octant, more investigation is required to determine the precise location of the sound source. -
Comparative Study Based on Network Performance of Ddos Attacks in Cloud for Its Scientific and Commercial Solutions
Dhananjay Shripad Rakshe, Sweta Jha, Sachin K. Korde, Pawan R. BhaladhareDieses Kapitel untersucht die Auswirkungen von Distributed Denial of Service (DDoS) -Angriffen auf Cloud-Umgebungen und konzentriert sich dabei sowohl auf wissenschaftliche als auch auf kommerzielle Lösungen. Es untersucht die Entwicklung von DDoS-Angriffen im Cloud Computing, die zur Bewertung der Netzwerkleistung verwendeten Messgrößen und die verschiedenen angewandten Minderungsstrategien. Die Studie vergleicht die Wirksamkeit verschiedener Nachweismethoden, einschließlich maschinellen Lernens, statistischer und hybrider Ansätze, unter Verwendung von Datensätzen wie KDD, NSL KDD, CAIDA, DARPA und CIDDS-1. Er geht auch auf die wirtschaftlichen Auswirkungen von DDoS-Angriffen und die Bedeutung proaktiver Sicherheitsmaßnahmen ein. Die Ergebnisse heben die Schwachstellen wissenschaftlicher Cloud-Lösungen und die Widerstandsfähigkeit kommerzieller Cloud-Dienste hervor und unterstreichen die Notwendigkeit maßgeschneiderter DDoS-Minderungsstrategien. Das Kapitel schließt mit Empfehlungen zur Verbesserung der Cybersicherheit in Cloud-Umgebungen, um die Kontinuität und Integrität von Cloud-basierten Diensten zu gewährleisten.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe widespread adoption of cloud computing has introduced a paradigm shift in how organizations operate, offering enhanced scalability, flexibility, and cost-efficiency. However, the reliance on cloud services has also attracted sophisticated cyber threats, particularly Distributed Denial of Service (DDoS) attacks, which pose significant risks to both scientific research and commercial applications. This study conducts a comparative analysis of network performance under DDoS attacks within cloud environments, aiming to dissect the efficacy of existing mitigation strategies and to underscore the different impacts on scientific versus commercial cloud services. Through a combination of literature review, simulation of real-world attack scenarios, and comprehensive performance metric analysis, this research elucidates the evolving landscape of DDoS threats and advances in mitigation technologies, providing critical insights for enhancing cloud security. -
Enhancing Deepfake Detection with Dynamic Dataset, Dataset Optimization and Transition Point Detection
Sangita Lade, Ajinkya Sharad Tambe, Prathamesh Prabhakar Thakare, Gourav Balaji Suram, Sujal Samir BokariyaDieses Kapitel vertieft sich in die entscheidende Frage der vertieften Erkennung von Fälschungen und betont die Notwendigkeit fortgeschrittener Techniken, um die wachsende Bedrohung durch digitale Manipulation zu bekämpfen. Die Autoren schlagen einen dynamischen Datensatzansatz vor, der sowohl generische als auch personalisierte Datensätze umfasst und eine genauere und benutzerspezifischere Erkennung ermöglicht. Die Meso4-Architektur zeichnet sich durch ihre hohe Genauigkeit bei der Identifizierung von Gesichtsartefakten und Abweichungen aus, die auf tiefgreifende Manipulation hindeuten. Das Kapitel führt auch in die Analyse von Zeitrahmen und die Erkennung von Übergangspunkten ein, die Einblicke in die zeitliche Dynamik der Vertiefung von Fake Production und das Ausmaß der Viktimisierung bieten. Die Ergebnisse zeigen signifikante Verbesserungen bei der Erkennungsgenauigkeit, wobei der modifizierte Datensatz einen F1-Wert von 87,84% und eine Genauigkeit von 96,44% erreichte. Das Kapitel schließt mit der Betonung der Wichtigkeit anpassungsfähiger Systeme zur Erkennung von Fälschungen, um die Integrität digitaler Medien in einer sich ständig weiterentwickelnden technologischen Landschaft aufrechtzuerhalten.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractThe emergence of deepfake technology presents a severe threat to truth and trust in the modern digital age, when fact and fiction regularly intersect. While fighting deepfakes that target celebrities has received a lot of attention, the issue of these digital lies becoming more prevalent in the lives of regular people is growing. Our solution offers a fresh method by combining flexible learning with the robust Meso4 architecture. Unlike earlier models trained on generic datasets, our approach enables users to personalize their experience by recognizing their own unique facial attributes by building a dataset of the user’s own face that comprises both genuine and deepfake images of the user. Still, we go above and beyond simple detection. We do a thorough analysis on each video frame, looking closely for minute changes. This study highlights the urgent necessity for “democratizing security” in the digital era of video manipulation in addition to revealing a ground-breaking defense against the dangers of deepfakes. The distinctive addition of our project is Transition Point Detection, which enhances the robustness of our detection approach by detecting critical places in films when actual material changes to deepfake content. -
Comparative Analysis of Deep State-of-the-Art CNN Architectures Over Food-101 Dataset Using Transfer Learning and the Impact of Fine Tuning
Faisal Rasheed, Arshad Ahmad Dar, Sarfaraz Ahmad, Gousiya HussainDieses Kapitel untersucht die vergleichende Analyse von zehn hochmodernen Convolutional Neural Network (CNN) -Architekturen - VGG16, VGG19, GoogleNet, MobileNet, DenseNet, XceptionNet, ResNet50, EfficientB0, EfficientB7 und Xception-ResNet - auf dem Food-101-Datensatz. Die Studie untersucht die Auswirkungen von Transferlern- und Feinabstimmungstechniken sowie Strategien zur Datenvergrößerung auf die Modellleistung. Zu den wichtigsten Ergebnissen gehört die deutliche Verbesserung der Genauigkeit und Stabilität von Modellen nach Feinabstimmung und Augmentierung, wobei Probleme wie Über- und Unterpassung angesprochen werden. Das Kapitel bietet auch einen detaillierten Vergleich der Modellleistung auf Grundlage der Anzahl der Parameter und der Genauigkeit der Validierung, sowohl mit als auch ohne Feinabstimmung. Darüber hinaus werden damit verbundene Arbeiten überprüft und die überlegene Leistung der optimierten EfficientB0-Modelle hervorgehoben. Die Studie schließt mit Einblicken in zukünftige Forschungsrichtungen und betont die Notwendigkeit weiterer Erkundungen aufstrebender CNN-Architekturen und fortschrittlicher Feinabstimmungs-Strategien.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIn this comprehensive study, we explore the Neural Architectures over the food Food101 dataset. Ten state-of-the-art Convolutional Neural Network (CNN) architectures serve as the foundation of our exploration which includes VGG16 [1], VGG19 [1], GoogleNet [2], ResNet50 [3], DenseNet [4], MobileNet [5], EfficientB0 [6], EfficientB7 [6], inception-ResNet [7], and XceptionNet [8]. Initially, these architectures were trained through transfer learning without any augmentation and fine-tuning to observe the results over the food101 dataset. Subsequently, we applied augmentation techniques and fine-tuning in order to observe their impact on model performance. Through conscientious comparative analysis, we unveil insights into the strengths and weaknesses of each architecture under standardized conditions. Our work extends beyond the empirical, incorporating a quantitative assessment of model performance, visually compelling representations of key metrics, and a thorough exploration of hyper-parameter settings. This work thus stands as a holistic exploration of the nuances within the realm of food images, promising both depth and applicability in the field. This work also presents the comparison of results with the other works in which our fine-tuned model was able to defeat the accuracy of other models over the food101 Dataset. -
Real-Time Exercise Tracking: Leveraging Pose Estimation with MobileNetV2 Architecture
Prajakta Tate, Shreya Thorvat, Atharva Talaghatti, Roshani Raut, Pradnya BorkarDieses Kapitel geht auf die Fortschritte bei der Echtzeit-Trainingsverfolgung ein und konzentriert sich auf die Verwendung von Pose Estimation mit der MobileNetV2 Architektur. Es beginnt mit einer Einführung in den Marktbedarf an personalisierten Fitnessanwendungen und der Rolle von Technologien wie Computer Vision und maschinellem Lernen bei der Bereitstellung von Echtzeit-Feedback. Die Literaturstudie beleuchtet die Grenzen traditioneller Trainingsvideos und die Entstehung von Anwendungen, die visuelle Hilfe für die richtige Haltung bieten. Der Methodenabschnitt skizziert einen strukturierten Ansatz zur Entwicklung einer Anwendung zur Verfolgung von Übungen in Echtzeit, einschließlich der Auswahl von Technologiestapeln, der Datenerfassung und der Vorverarbeitung. Außerdem wird die Implementierung von Pose-Schätzmodellen mit MediaPipe und OpenPose und die Integration dieser Modelle in das Anwendungsrahmenwerk diskutiert. Der Ergebnisbereich präsentiert eine vergleichende Analyse von MediaPipe und YOLOv7, die die Leistungsunterschiede zwischen den beiden Modellen hervorhebt. Die Schlussfolgerung untersucht den zukünftigen Umfang von Fitnessanwendungen, einschließlich des Potenzials für personalisierte mobile Apps, Sprachassistenten und KI-gestützte Empfehlungen. Insgesamt bietet dieses Kapitel einen umfassenden Überblick über die Technologien und Methoden hinter der Echtzeit-Trainingsverfolgung und bietet wertvolle Einblicke für Profis in der Fitness- und Technologiebranche.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIn the sphere of fitness and exercise, the correct performing of exercises plays an important role in acquiring desired results and preventing injuries. A brief study of various Machine learning frameworks is mentioned below, which help us understand the inner workings of the various exercise tracking application models present currently. This research paper presents an application that avails this functionality using Python, providing real-time assistance for users to exercise. It will be done via displaying visual cues on the screen while the user is exercising. Integration of live web-cam or camera-enabled devices with the model, which captures the user’s movements and analyzes their postures in real-time to provide feedback. The purpose of the model is mainly to understand the working of Media pipe and OpenCV in practical and real-life problem statements, instead of just Object detection and pose estimation [1]. The paper contains technical implementation of the exercise model using Python code, including the process of capturing and processing video input, performing pose estimation and movement analysis and rendering interactive visual feedback to the user. The results demonstrate how basic Python-based applications can provide practical help for users in the domain of exercise and health. Further the future scope of the project has been discussed, the idea of its conversion into a mobile application, and to add voice assistance to the application to improve user experience. -
Advanced IoT-Based Health Monitoring Systems: Enhancing Patient Care Through Real-Time Data, Predictive Analytics, and 5G-Enabled Connectivity
R. Dilip, G. Kavyashri, M. H. Nishchitha, N. Tejashwini, G. Madhura, M. G. ManasaDieses Kapitel geht auf das transformative Potenzial fortschrittlicher IoT-basierter Gesundheitsüberwachungssysteme ein und konzentriert sich auf Echtzeit-Datenerfassung, vorausschauende Analysen und die Rolle der 5G-Konnektivität. Es wird aufgezeigt, wie diese Systeme eine kontinuierliche Überwachung lebenswichtiger Gesundheitsparameter ermöglichen, unmittelbare Reaktionen auf Anomalien ermöglichen und die Ergebnisse der Patienten verbessern. Der Artikel diskutiert auch die Integration von maschinellen Lernalgorithmen für prädiktive Analysen, die Gesundheitsrisiken erkennen und frühzeitige Interventionen ermöglichen können. Darüber hinaus werden die Vorteile der 5G-Technologie bei der Verbesserung der Datenübertragung und Konnektivität untersucht, wodurch die Skalierbarkeit von Gesundheitsüberwachungssystemen erleichtert wird. Die Simulationsergebnisse zeigen die überlegene Genauigkeit und Leistung des vorgeschlagenen IoT-basierten Systems im Vergleich zu herkömmlichen Methoden und unterstreichen sein Potenzial, die Patientenversorgung zu revolutionieren. Das Kapitel schließt mit einer Skizze zukünftiger Richtungen, einschließlich der Integration neuer Biomarker, Fortschritten bei KI und ML und dem Ausbau von 5G-Netzwerken, die versprechen, die Fähigkeiten von Gesundheitsüberwachungssystemen weiter zu verbessern.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIoT technology in health monitoring systems enables real-time data collection, predictive analytics, and 5G network connection, improving patient care. This new IoT-based health monitoring system improves patient outcomes via remote monitoring and early intervention. This page describes the technology in full. The proposed concept uses smart medical equipment and wearable sensors to measure glucose, blood pressure, and heart rate. A centralized health management platform gets these data streams in real time via 5G technology for fast responses. Predictive analytics, which utilizes machine learning algorithms to analyze previous and current data, is crucial to detecting patterns and health risks early. This preventive strategy permits early intervention, which may reduce hospitalization and enhance patient care. Our simulation environment mimics real-life conditions to test the proposed model’s functionality. The simulation demonstrated the system’s ability to deliver precise, real-time health monitoring and predictive insights by integrating 5G connections for smooth data flow and rapid response. The results show that IoT-based health monitoring systems may transform patient care by providing targeted, data-driven insights and timely responses. This study concludes with research and development proposals to enhance the system and solve real-world challenges. -
Enhanced Dark and Light Channel Priors for Single-Image De-hazing
Parmeet Kaur, Sandhya BansalDas Kapitel Enhanced Dark and Light Channel Priors for Single-Image De-hazing geht dem entscheidenden Prozess der Verbesserung der Bildklarheit unter nebelhaften Bedingungen nach, eine Herausforderung, die in Außenumgebungen vorherrscht. Der Text untersucht die Beschränkungen aktueller De-Hazing-Techniken wie ungenaue atmosphärische Parametereinschätzungen und Farbverzerrungen und führt einen neuartigen Ansatz ein, der adaptive Entzerrung, Nachbarschaftsschärfung und Gammakorrektur innerhalb des L * A * B-Farbraums nutzt. Diese Methode zielt darauf ab, die Wahrnehmungsqualität und die Recheneffizienz zu verbessern, wodurch sie sich für Anwendungen wie Überwachung und autonomes Fahren eignet. Das Kapitel behandelt auch die Extraktion von Helligkeits-, Chroma- und Hervorhebungsinformationen aus hellen und dunklen Kanälen, um den globalen atmosphärischen Kontrast genau abzuschätzen. Bewertungskennzahlen wie PSNR, SSIM und FADE werden verwendet, um den vorgeschlagenen Algorithmus mit modernsten Methoden zu vergleichen und seine überlegene Leistung bei der Verbesserung der Bildqualität und der Verringerung der Verarbeitungszeit zu demonstrieren. Die Ergebnisse unterstreichen das Potenzial der vorgeschlagenen Methode zur Neudefinition des Single-Image-De-Hazings, das eine robuste Lösung für reale Szenarien bietet.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractIn the realm of image processing, haze remains a pervasive challenge that significantly degrades the visibility and clarity of outdoor images. Such degradation not only hinders human perception but also impairs the performance of various computer vision applications. Existing de-hazing techniques often struggle with the complex interplay of light and colour, leading to suboptimal restoration of true scene radiance. This work addresses the limitations of current methods, which frequently rely on insufficiently robust priors, neglecting the nuanced variations of atmospheric light scattering. These challenges are compounded when images lack ground truth data, rendering the assessment of enhancement quality particularly difficult. Consequently, there is a pressing need for an approach that adapts to varying haze densities and provides a reliable quality metric in the absence of reference images. Responding to this, the presented research proposes a novel framework for single-image de-hazing that introduces improved pre-processing steps including adaptive equalization, neighbourhood sharpening, and gamma correction within the LAB colour space model. A multi-colour space-based model is also introduced, utilizing Light Channel Prior and Dark Channel Priors to estimate global atmospheric contrast more accurately. The methodology is comprehensive, employing quantitative metrics such as Peak Signal-to-Noise Ratio (PSNR), Structural Similarity Index Measure (SSIM), processing time, and the fog-aware density evaluator (FADE) score for performance evaluation. -
Analysis of Deep Learning Approaches in Biometric System
Seema Rani, Neeraj Mohan, Priyanka KaushalDieses Kapitel untersucht die transformativen Auswirkungen von Deep Learning auf biometrische Systeme, insbesondere im Bereich der Gesichtserkennung. Es bietet eine umfassende Bewertung von vier bekannten Deep-Learning-Modellen - AlexNet, VGGFace, FaceNet und ResNet -, die ihre Stärken und Grenzen aufzeigen. Der Aufsatz geht auch auf die Herausforderungen bei der Implementierung dieser Modelle ein, wie etwa die Komplexität der Berechnungen und das Risiko einer Überanpassung. Der Bericht schließt mit Einblicken in zukünftige Entwicklungen, einschließlich der Integration multimodaler biometrischer Systeme und der Entwicklung hoch entwickelter Liveness-Detection-Techniken. Die Studie bietet eine detaillierte vergleichende Analyse dieser Modelle und liefert wertvolle Erkenntnisse für Fachleute, die die Genauigkeit und Robustheit biometrischer Systeme verbessern wollen. Die Ergebnisse unterstreichen die Wichtigkeit der Auswahl des geeigneten Deep-Learning-Modells, um eine hohe Präzision in biometrischen Anwendungen zu erreichen, was es zu einer entscheidenden Lektüre für diejenigen macht, die an der Entwicklung und Implementierung biometrischer Technologien beteiligt sind.KI-Generiert
Diese Zusammenfassung des Fachinhalts wurde mit Hilfe von KI generiert.
AbstractMachine Learning (ML) has shown progressive growth in recent years, with deep learning (DL) emerging as an effective method for analyzing complicated data and generating accurate inferences. Diverse fields like computer vision, pattern recognition and natural language processing extensively utilize DL models, drawing motivation from the structure and function of the human brain. DL has confirmed significant promise in the field of biometric systems, which depend on distinct physiological and behavioral characteristics for identification and verification. This study provides a comprehensive assessment of several DL methods aimed at enhancing biometric systems, specifically in the field of face-recognition. This research suggests a methodology for evaluating DL models such as AlexNet, VGGFace, FaceNet, and ResNet in order to identify the best appropriate model for facial recognition applications. The purpose of this framework is to guide the development of biometric systems that are both more precise and efficient. We conducted the assessment on a real facial dataset that we collected from Kaggle. We use accuracy, precision, recall, and F1-measure parameters to compare the performance of different models. In ResNet, the accuracy is 98%, which is higher than the other three models. -
Backmatter
- Titel
- Advancements in Generative Artificial Intelligence
- Herausgegeben von
-
Nikhil Kumar Marriwala
Shruti Jain
P. William
Dinesh Kumar
- Copyright-Jahr
- 2026
- Verlag
- Springer Nature Singapore
- Electronic ISBN
- 978-981-9660-95-7
- Print ISBN
- 978-981-9660-94-0
- DOI
- https://doi.org/10.1007/978-981-96-6095-7
Die PDF-Dateien dieses Buches wurden gemäß dem PDF/UA-1-Standard erstellt, um die Barrierefreiheit zu verbessern. Dazu gehören Bildschirmlesegeräte, beschriebene nicht-textuelle Inhalte (Bilder, Grafiken), Lesezeichen für eine einfache Navigation, tastaturfreundliche Links und Formulare sowie durchsuchbarer und auswählbarer Text. Wir sind uns der Bedeutung von Barrierefreiheit bewusst und freuen uns über Anfragen zur Barrierefreiheit unserer Produkte. Bei Fragen oder Bedarf an Barrierefreiheit kontaktieren Sie uns bitte unter accessibilitysupport@springernature.com.