Featre selection on large-scale issues using clustering and meta-algorithms - Núm. 7-13, Marzo 2018 - Amazonía Investiga - Libros y Revistas - VLEX 908534815

Featre selection on large-scale issues using clustering and meta-algorithms

AutorFardin Akhlaghian Tab, Shabnam Amiri
CargoFardin Akhlaghian Tab, Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM) English Language Department, Faculty of Communication and Modern LanguagesUniversiti Putra Malaysia (UPM) Shabnam Amiri, Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM) English Language Department, Faculty of ...
Páginas17-30
Vol. 7 Núm. 13
/Marzo - Abril 2018/
Encuentre este artículo en h ttp: //ww w.u dla. edu. co/r evi stas /ind ex. php/ amaz oni a-i nves tiga ISS N 23 22- 6307
17
Artículo de investigación
Featre selection on large-scale issues using clustering
and meta-algorithms
Característica de selección en campos de escala grande utilizando clústeres y meta-algoritmos
Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos
Recibido: 20 de abril de 2018. Aceptado: 10 de mayo de 2018
Escrito por:
Fardin Akhlaghian Tab
(Corresponding Author)
Shabnam Amiri
English Language Department, Faculty of Communication and Modern Languages
Universiti Putra Malaysia (UPM)
Emails:nimechie@gmail.com
Abstract
Selection of appropriate input features in the
increase of the efficiency of data mining
algorithms has a direct and significant effect.
More precisely, this extraction of knowledge
from problem data is facilitated by three things:
reducing data volumes, eliminating duplicate
features, and eliminating unrelated features.
Given this necessity, extensive research has been
carried out in recent years with a variety of trends
(statistical, algorithmic, and l earning) in this
regard. In the meantime, hyper-algorithms such
as genetic algorithms have been considered by
many researchers. In this research, we have tried
to achieve more efficiency by combining
clustering and genetic algorithms and reducing
computational time.
In this regard, a new representation of the
genetic algorithm corresponding to thi s problem
is presented and its operators are appropriately
defined. Also, for efficient use of clustering in this
study, it was necessary to provide a rela tively
new algorithm for rapid clustering. To validate
the proposed methods and determine their
efficiency in solving real problems, several
experiments have been carried out on standard
data. In the next step, analyzing the proposed
methods, we compared the results of the
experiments with various algorithms reported in
valid and new articles. These comparisons have
shown improvements in the efficiency of
proposed methods in terms of the accuracy of
categorization and feature reduction compared
to competing methods. According to the analysis,
this improvement was due to the positive effect
Resumen
La selección de las características de entrada
apropiadas en el aumento de la eficiencia de los
algoritmos de minería de datos tiene un efecto
directo y significativo. Más precisamente, esta
extracción de conocimiento de lo s datos de
problemas se ve facilitada por tres factores: la
reducción de volúmenes de datos, la eliminación
de características duplicadas y la eliminación de
características no relacionadas. Dada esta
necesidad, se ha llevado a cabo una extensa
investigación en los últimos años con una
variedad de tendencias (estadística, algorítmica y
de aprendizaje) en este sentido. Mientras tanto,
hiper-algoritmos tales como algoritmos
genéticos han sido co nsiderados por muchos
investigadores. En esta investigación, hemos
intentado lograr una mayor eficiencia
combinando clustering y algoritmos genéticos y
reduciendo el tiempo de computación.
En este sentido, se presenta una nueva
representación del algoritmo genético
correspondiente a este problema y sus
operadores se definen de manera apropiada.
Además, para un uso eficiente de la agrupación
en este estudio, fue necesario proporcionar un
algoritmo relativamente nuevo para la
agrupación rápida. Para validar los métodos
propuestos y determinar su eficacia en la
resolución de problemas reales, se han llevado a
cabo varios experimentos con datos estándar. En
el siguiente paso, al analizar los métodos
propuestos, comparamos los resultados de los
experimentos con varios algoritmos informados
en artículos válidos y nuevos. Estas

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR