Highlight

Những điều thú vị khi dùng Trí tuệ nhân tạo của Viettel

Những người dùng Internet tại Việt Nam thường lấy “chị Google” ra để… giải trí. Khi “chị” đọc văn bản hay chỉ đường cho người tham gia gi...

Tuesday, March 8, 2016

Artificial intelligence From Wikipedia, the free encyclopedia


Artificial intelligence (AI) is the intelligence exhibited by machines or software. It is also the name of the academic field of study which studies how to create computers and computer software that are capable of intelligent behavior. Major AI researchers and textbooks define this field as "the study and design of intelligent agents",[1] in which an intelligent agent is a system that perceives its environment and takes actions that maximize its chances of success.[2] John McCarthy, who coined the term in 1955,[3] defines it as "the science and engineering of making intelligent machines".[4]
AI research is highly technical and specialized, and is deeply divided into subfields that often fail to communicate with each other.[5] Some of the division is due to social and cultural factors: subfields have grown up around particular institutions and the work of individual researchers. AI research is also divided by several technical issues. Some subfields focus on the solution of specific problems. Others focus on one of several possible approaches or on the use of a particular tool or towards the accomplishment of particular applications.
The central problems (or goals) of AI research include reasoning, knowledge, planning, learning, natural language processing (communication), perception and the ability to move and manipulate objects.[6] General intelligence is still among the field's long-term goals.[7] Currently popular approaches include statistical methods, computational intelligence and traditional symbolic AI. There are a large number of tools used in AI, including versions of search and mathematical optimization, logic, methods based on probability and economics, and many others. The AI field is interdisciplinary, in which a number of sciences and professions converge, including computer science, mathematics, psychology, linguistics, philosophy and neuroscience, as well as other specialized fields such as artificial psychology.
The field was founded on the claim that a central property of humans, human intelligence—the sapience of Homo sapiens sapiens—"can be so precisely described that a machine can be made to simulate it."[8] This raises philosophical arguments about the nature of the mind and the ethics of creating artificial beings endowed with human-like intelligence, issues which have been explored by myth, fiction and philosophy since antiquity.[9] Artificial intelligence has been the subject of tremendous optimism[10] but has also suffered stunning setbacks.[11] Today it has become an essential part of the technology industry, providing the heavy lifting for many of the most challenging problems in computer science.[12]

History

Thinking machines and artificial beings appear in Greek myths, such as Talos of Crete, the bronze robot of Hephaestus, and Pygmalion's Galatea.[13] Human likenesses believed to have intelligence were built in every major civilization: animated cult images were worshiped in Egypt and Greece[14] and humanoid automatons were built by Yan Shi, Hero of Alexandria and Al-Jazari.[15] It was also widely believed that artificial beings had been created by Jābir ibn Hayyān, Judah Loew and Paracelsus.[16] By the 19th and 20th centuries, artificial beings had become a common feature in fiction, as in Mary Shelley's Frankenstein or Karel Čapek's R.U.R. (Rossum's Universal Robots).[17] Pamela McCorduck argues that all of these are some examples of an ancient urge, as she describes it, "to forge the gods".[9] Stories of these creatures and their fates discuss many of the same hopes, fears and ethical concerns that are presented by artificial intelligence.
Mechanical or "formal" reasoning has been developed by philosophers and mathematicians since antiquity. The study of logic led directly to the invention of the programmable digital electronic computer, based on the work of mathematician Alan Turing and others. Turing's theory of computation suggested that a machine, by shuffling symbols as simple as "0" and "1", could simulate any conceivable act of mathematical deduction.[18][19] This, along with concurrent discoveries in neurology, information theory and cybernetics, inspired a small group of researchers to begin to seriously consider the possibility of building an electronic brain.[20]
The field of AI research was founded at a conference on the campus of Dartmouth College in the summer of 1956.[21] The attendees, including John McCarthy, Marvin Minsky, Allen Newell, Arthur Samuel, and Herbert Simon, became the leaders of AI research for many decades.[22] They and their students wrote programs that were, to most people, simply astonishing:[23] computers were winning at checkers, solving word problems in algebra, proving logical theorems and speaking English.[24] By the middle of the 1960s, research in the U.S. was heavily funded by the Department of Defense[25] and laboratories had been established around the world.[26] AI's founders were profoundly optimistic about the future of the new field: Herbert Simon predicted that "machines will be capable, within twenty years, of doing any work a man can do" and Marvin Minsky agreed, writing that "within a generation ... the problem of creating 'artificial intelligence' will substantially be solved".[27]
They had failed to recognize the difficulty of some of the problems they faced.[28] In 1974, in response to the criticism of Sir James Lighthill[29] and ongoing pressure from the US Congress to fund more productive projects, both the U.S. and British governments cut off all undirected exploratory research in AI. The next few years would later be called an "AI winter",[30] a period when funding for AI projects was hard to find.
In the early 1980s, AI research was revived by the commercial success of expert systems,[31] a form of AI program that simulated the knowledge and analytical skills of one or more human experts. By 1985 the market for AI had reached over a billion dollars. At the same time, Japan's fifth generation computer project inspired the U.S and British governments to restore funding for academic research in the field.[32] However, beginning with the collapse of the Lisp Machine market in 1987, AI once again fell into disrepute, and a second, longer-lasting AI winter began.[33]
In the 1990s and early 21st century, AI achieved its greatest successes, albeit somewhat behind the scenes. Artificial intelligence is used for logistics, data mining, medical diagnosis and many other areas throughout the technology industry.[12] The success was due to several factors: the increasing computational power of computers (see Moore's law), a greater emphasis on solving specific subproblems, the creation of new ties between AI and other fields working on similar problems, and a new commitment by researchers to solid mathematical methods and rigorous scientific standards.[34]
On 11 May 1997, Deep Blue became the first computer chess-playing system to beat a reigning world chess champion, Garry Kasparov.[35] In February 2011, in a Jeopardy! quiz show exhibition match, IBM's question answering system, Watson, defeated the two greatest Jeopardy champions, Brad Rutter and Ken Jennings, by a significant margin.[36] The Kinect, which provides a 3D body–motion interface for the Xbox 360 and the Xbox One, uses algorithms that emerged from lengthy AI research[37] as do intelligent personal assistants in smartphones.[38]

Research

Goals

The general problem of simulating (or creating) intelligence has been broken down into a number of specific sub-problems. These consist of particular traits or capabilities that researchers would like an intelligent system to display. The traits described below have received the most attention.[6]

Deduction, reasoning, problem solving

Early AI researchers developed algorithms that imitated the step-by-step reasoning that humans use when they solve puzzles or make logical deductions.[39] By the late 1980s and 1990s, AI research had also developed highly successful methods for dealing with uncertain or incomplete information, employing concepts from probability and economics.[40]
For difficult problems, most of these algorithms can require enormous computational resources – most experience a "combinatorial explosion": the amount of memory or computer time required becomes astronomical when the problem goes beyond a certain size. The search for more efficient problem-solving algorithms is a high priority for AI research.[41]
Human beings solve most of their problems using fast, intuitive judgements rather than the conscious, step-by-step deduction that early AI research was able to model.[42] AI has made some progress at imitating this kind of "sub-symbolic" problem solving: embodied agent approaches emphasize the importance of sensorimotor skills to higher reasoning; neural net research attempts to simulate the structures inside the brain that give rise to this skill; statistical approaches to AI mimic the probabilistic nature of the human ability to guess.

Knowledge representation

An ontology represents knowledge as a set of concepts within a domain and the relationships between those concepts.
Knowledge representation[43] and knowledge engineering[44] are central to AI research. Many of the problems machines are expected to solve will require extensive knowledge about the world. Among the things that AI needs to represent are: objects, properties, categories and relations between objects;[45] situations, events, states and time;[46] causes and effects;[47] knowledge about knowledge (what we know about what other people know);[48] and many other, less well researched domains. A representation of "what exists" is an ontology: the set of objects, relations, concepts and so on that the machine knows about. The most general are called upper ontologies, which attempt to provide a foundation for all other knowledge.[49]
Among the most difficult problems in knowledge representation are:
Default reasoning and the qualification problem
Many of the things people know take the form of "working assumptions." For example, if a bird comes up in conversation, people typically picture an animal that is fist sized, sings, and flies. None of these things are true about all birds. John McCarthy identified this problem in 1969[50] as the qualification problem: for any commonsense rule that AI researchers care to represent, there tend to be a huge number of exceptions. Almost nothing is simply true or false in the way that abstract logic requires. AI research has explored a number of solutions to this problem.[51]
The breadth of commonsense knowledge
The number of atomic facts that the average person knows is astronomical. Research projects that attempt to build a complete knowledge base of commonsense knowledge (e.g., Cyc) require enormous amounts of laborious ontological engineering—they must be built, by hand, one complicated concept at a time.[52] A major goal is to have the computer understand enough concepts to be able to learn by reading from sources like the internet, and thus be able to add to its own ontology.[citation needed]
The subsymbolic form of some commonsense knowledge
Much of what people know is not represented as "facts" or "statements" that they could express verbally. For example, a chess master will avoid a particular chess position because it "feels too exposed"[53] or an art critic can take one look at a statue and instantly realize that it is a fake.[54] These are intuitions or tendencies that are represented in the brain non-consciously and sub-symbolically.[55] Knowledge like this informs, supports and provides a context for symbolic, conscious knowledge. As with the related problem of sub-symbolic reasoning, it is hoped that situated AI, computational intelligence, or statistical AI will provide ways to represent this kind of knowledge.[55]

Planning

A hierarchical control system is a form of control system in which a set of devices and governing software is arranged in a hierarchy.
Intelligent agents must be able to set goals and achieve them.[56] They need a way to visualize the future (they must have a representation of the state of the world and be able to make predictions about how their actions will change it) and be able to make choices that maximize the utility (or "value") of the available choices.[57]
In classical planning problems, the agent can assume that it is the only thing acting on the world and it can be certain what the consequences of its actions may be.[58] However, if the agent is not the only actor, it must periodically ascertain whether the world matches its predictions and it must change its plan as this becomes necessary, requiring the agent to reason under uncertainty.[59]
Multi-agent planning uses the cooperation and competition of many agents to achieve a given goal. Emergent behavior such as this is used by evolutionary algorithms and swarm intelligence.[60]

Learning

Main article: Machine learning
Machine learning is the study of computer algorithms that improve automatically through experience[61][62] and has been central to AI research since the field's inception.[63]
Unsupervised learning is the ability to find patterns in a stream of input. Supervised learning includes both classification and numerical regression. Classification is used to determine what category something belongs in, after seeing a number of examples of things from several categories. Regression is the attempt to produce a function that describes the relationship between inputs and outputs and predicts how the outputs should change as the inputs change. In reinforcement learning[64] the agent is rewarded for good responses and punished for bad ones. The agent uses this sequence of rewards and punishments to form a strategy for operating in its problem space. These three types of learning can be analyzed in terms of decision theory, using concepts like utility. The mathematical analysis of machine learning algorithms and their performance is a branch of theoretical computer science known as computational learning theory.[65]
Within developmental robotics, developmental learning approaches were elaborated for lifelong cumulative acquisition of repertoires of novel skills by a robot, through autonomous self-exploration and social interaction with human teachers, and using guidance mechanisms such as active learning, maturation, motor synergies, and imitation.[66][67][68][69]

Natural language processing (communication)

A parse tree represents the syntactic structure of a sentence according to some formal grammar.
Natural language processing[70] gives machines the ability to read and understand the languages that humans speak. A sufficiently powerful natural language processing system would enable natural language user interfaces and the acquisition of knowledge directly from human-written sources, such as newswire texts. Some straightforward applications of natural language processing include information retrieval (or text mining), question answering[71] and machine translation.[72]
A common method of processing and extracting meaning from natural language is through semantic indexing. Increases in processing speeds and the drop in the cost of data storage makes indexing large volumes of abstractions of the user's input much more efficient.

Perception

Machine perception[73] is the ability to use input from sensors (such as cameras, microphones, tactile sensors, sonar and others more exotic) to deduce aspects of the world. Computer vision[74] is the ability to analyze visual input. A few selected subproblems are speech recognition,[75] facial recognition and object recognition.[76]

Motion and manipulation

Main article: Robotics
The field of robotics[77] is closely related to AI. Intelligence is required for robots to be able to handle such tasks as object manipulation[78] and navigation, with sub-problems of localization (knowing where you are, or finding out where other things are), mapping (learning what is around you, building a map of the environment), and motion planning (figuring out how to get there) or path planning (going from one point in space to another point, which may involve compliant motion – where the robot moves while maintaining physical contact with an object).[79][80]

Long-term goals

Among the long-term goals in the research pertaining to artificial intelligence are: (1) Social intelligence, (2) Creativity, and (3) General intelligence.
Social intelligence
Main article: Affective computing
Kismet, a robot with rudimentary social skills[81]
Affective computing is the study and development of systems and devices that can recognize, interpret, process, and simulate human affects.[82][83] It is an interdisciplinary field spanning computer sciences, psychology, and cognitive science.[84] While the origins of the field may be traced as far back as to early philosophical inquiries into emotion,[85] the more modern branch of computer science originated with Rosalind Picard's 1995 paper[86] on affective computing.[87][88] A motivation for the research is the ability to simulate empathy. The machine should interpret the emotional state of humans and adapt its behaviour to them, giving an appropriate response for those emotions.
Emotion and social skills[89] play two roles for an intelligent agent. First, it must be able to predict the actions of others, by understanding their motives and emotional states. (This involves elements of game theory, decision theory, as well as the ability to model human emotions and the perceptual skills to detect emotions.) Also, in an effort to facilitate human-computer interaction, an intelligent machine might want to be able to display emotions—even if it does not actually experience them itself—in order to appear sensitive to the emotional dynamics of human interaction.
Creativity
A sub-field of AI addresses creativity both theoretically (from a philosophical and psychological perspective) and practically (via specific implementations of systems that generate outputs that can be considered creative, or systems that identify and assess creativity). Related areas of computational research are Artificial intuition and Artificial thinking.
General intelligence
Many researchers think that their work will eventually be incorporated into a machine with general intelligence (known as strong AI), combining all the skills above and exceeding human abilities at most or all of them.[7] A few believe that anthropomorphic features like artificial consciousness or an artificial brain may be required for such a project.[90][91]
Many of the problems above may require general intelligence to be considered solved. For example, even a straightforward, specific task like machine translation requires that the machine read and write in both languages (NLP), follow the author's argument (reason), know what is being talked about (knowledge), and faithfully reproduce the author's intention (social intelligence). A problem like machine translation is considered "AI-complete". In order to solve this particular problem, you must solve all the problems.[92]

Approaches

There is no established unifying theory or paradigm that guides AI research. Researchers disagree about many issues.[93] A few of the most long standing questions that have remained unanswered are these: should artificial intelligence simulate natural intelligence by studying psychology or neurology? Or is human biology as irrelevant to AI research as bird biology is to aeronautical engineering?[94] Can intelligent behavior be described using simple, elegant principles (such as logic or optimization)? Or does it necessarily require solving a large number of completely unrelated problems?[95] Can intelligence be reproduced using high-level symbols, similar to words and ideas? Or does it require "sub-symbolic" processing?[96] John Haugeland, who coined the term GOFAI (Good Old-Fashioned Artificial Intelligence), also proposed that AI should more properly be referred to as synthetic intelligence,[97] a term which has since been adopted by some non-GOFAI researchers.[98][99]

Cybernetics and brain simulation

In the 1940s and 1950s, a number of researchers explored the connection between neurology, information theory, and cybernetics. Some of them built machines that used electronic networks to exhibit rudimentary intelligence, such as W. Grey Walter's turtles and the Johns Hopkins Beast. Many of these researchers gathered for meetings of the Teleological Society at Princeton University and the Ratio Club in England.[20] By 1960, this approach was largely abandoned, although elements of it would be revived in the 1980s.

Symbolic

Main article: Symbolic AI
When access to digital computers became possible in the middle 1950s, AI research began to explore the possibility that human intelligence could be reduced to symbol manipulation. The research was centered in three institutions: Carnegie Mellon University, Stanford and MIT, and each one developed its own style of research. John Haugeland named these approaches to AI "good old fashioned AI" or "GOFAI".[100] During the 1960s, symbolic approaches had achieved great success at simulating high-level thinking in small demonstration programs. Approaches based on cybernetics or neural networks were abandoned or pushed into the background.[101] Researchers in the 1960s and the 1970s were convinced that symbolic approaches would eventually succeed in creating a machine with artificial general intelligence and considered this the goal of their field.
Cognitive simulation
Economist Herbert Simon and Allen Newell studied human problem-solving skills and attempted to formalize them, and their work laid the foundations of the field of artificial intelligence, as well as cognitive science, operations research and management science. Their research team used the results of psychological experiments to develop programs that simulated the techniques that people used to solve problems. This tradition, centered at Carnegie Mellon University would eventually culminate in the development of the Soar architecture in the middle 1980s.[102][103]
Logic-based
Unlike Newell and Simon, John McCarthy felt that machines did not need to simulate human thought, but should instead try to find the essence of abstract reasoning and problem solving, regardless of whether people used the same algorithms.[94] His laboratory at Stanford (SAIL) focused on using formal logic to solve a wide variety of problems, including knowledge representation, planning and learning.[104] Logic was also the focus of the work at the University of Edinburgh and elsewhere in Europe which led to the development of the programming language Prolog and the science of logic programming.[105]
"Anti-logic" or "scruffy"
Researchers at MIT (such as Marvin Minsky and Seymour Papert)[106] found that solving difficult problems in vision and natural language processing required ad-hoc solutions – they argued that there was no simple and general principle (like logic) that would capture all the aspects of intelligent behavior. Roger Schank described their "anti-logic" approaches as "scruffy" (as opposed to the "neat" paradigms at CMU and Stanford).[95] Commonsense knowledge bases (such as Doug Lenat's Cyc) are an example of "scruffy" AI, since they must be built by hand, one complicated concept at a time.[107]
Knowledge-based
When computers with large memories became available around 1970, researchers from all three traditions began to build knowledge into AI applications.[108] This "knowledge revolution" led to the development and deployment of expert systems (introduced by Edward Feigenbaum), the first truly successful form of AI software.[31] The knowledge revolution was also driven by the realization that enormous amounts of knowledge would be required by many simple AI applications.

Sub-symbolic

By the 1980s progress in symbolic AI seemed to stall and many believed that symbolic systems would never be able to imitate all the processes of human cognition, especially perception, robotics, learning and pattern recognition. A number of researchers began to look into "sub-symbolic" approaches to specific AI problems.[96]
Bottom-up, embodied, situated, behavior-based or nouvelle AI
Researchers from the related field of robotics, such as Rodney Brooks, rejected symbolic AI and focused on the basic engineering problems that would allow robots to move and survive.[109] Their work revived the non-symbolic viewpoint of the early cybernetics researchers of the 1950s and reintroduced the use of control theory in AI. This coincided with the development of the embodied mind thesis in the related field of cognitive science: the idea that aspects of the body (such as movement, perception and visualization) are required for higher intelligence.
Computational intelligence and soft computing
Interest in neural networks and "connectionism" was revived by David Rumelhart and others in the middle 1980s.[110] Neural networks are an example of soft computing --- they are solutions to problems which cannot be solved with complete logical certainty, and where an approximate solution is often enough. Other soft computing approaches to AI include fuzzy systems, evolutionary computation and many statistical tools. The application of soft computing to AI is studied collectively by the emerging discipline of computational intelligence.[111]

Statistical

In the 1990s, AI researchers developed sophisticated mathematical tools to solve specific subproblems. These tools are truly scientific, in the sense that their results are both measurable and verifiable, and they have been responsible for many of AI's recent successes. The shared mathematical language has also permitted a high level of collaboration with more established fields (like mathematics, economics or operations research). Stuart Russell and Peter Norvig describe this movement as nothing less than a "revolution" and "the victory of the neats."[34] Critics argue that these techniques (with few exceptions[112]) are too focused on particular problems and have failed to address the long-term goal of general intelligence.[113] There is an ongoing debate about the relevance and validity of statistical approaches in AI, exemplified in part by exchanges between Peter Norvig and Noam Chomsky.[114][115]

Integrating the approaches

Intelligent agent paradigm
An intelligent agent is a system that perceives its environment and takes actions which maximize its chances of success. The simplest intelligent agents are programs that solve specific problems. More complicated agents include human beings and organizations of human beings (such as firms). The paradigm gives researchers license to study isolated problems and find solutions that are both verifiable and useful, without agreeing on one single approach. An agent that solves a specific problem can use any approach that works – some agents are symbolic and logical, some are sub-symbolic neural networks and others may use new approaches. The paradigm also gives researchers a common language to communicate with other fields—such as decision theory and economics—that also use concepts of abstract agents. The intelligent agent paradigm became widely accepted during the 1990s.[2]
Agent architectures and cognitive architectures
Researchers have designed systems to build intelligent systems out of interacting intelligent agents in a multi-agent system.[116] A system with both symbolic and sub-symbolic components is a hybrid intelligent system, and the study of such systems is artificial intelligence systems integration. A hierarchical control system provides a bridge between sub-symbolic AI at its lowest, reactive levels and traditional symbolic AI at its highest levels, where relaxed time constraints permit planning and world modelling.[117] Rodney Brooks' subsumption architecture was an early proposal for such a hierarchical system.[118]

Tools

In the course of 50 years of research, AI has developed a large number of tools to solve the most difficult problems in computer science. A few of the most general of these methods are discussed below.

Search and optimization

Many problems in AI can be solved in theory by intelligently searching through many possible solutions:[119] Reasoning can be reduced to performing a search. For example, logical proof can be viewed as searching for a path that leads from premises to conclusions, where each step is the application of an inference rule.[120] Planning algorithms search through trees of goals and subgoals, attempting to find a path to a target goal, a process called means-ends analysis.[121] Robotics algorithms for moving limbs and grasping objects use local searches in configuration space.[78] Many learning algorithms use search algorithms based on optimization.
Simple exhaustive searches[122] are rarely sufficient for most real world problems: the search space (the number of places to search) quickly grows to astronomical numbers. The result is a search that is too slow or never completes. The solution, for many problems, is to use "heuristics" or "rules of thumb" that eliminate choices that are unlikely to lead to the goal (called "pruning the search tree"). Heuristics supply the program with a "best guess" for the path on which the solution lies.[123] Heuristics limit the search for solutions into a smaller sample size.[79]
A very different kind of search came to prominence in the 1990s, based on the mathematical theory of optimization. For many problems, it is possible to begin the search with some form of a guess and then refine the guess incrementally until no more refinements can be made. These algorithms can be visualized as blind hill climbing: we begin the search at a random point on the landscape, and then, by jumps or steps, we keep moving our guess uphill, until we reach the top. Other optimization algorithms are simulated annealing, beam search and random optimization.[124]
Evolutionary computation uses a form of optimization search. For example, they may begin with a population of organisms (the guesses) and then allow them to mutate and recombine, selecting only the fittest to survive each generation (refining the guesses). Forms of evolutionary computation include swarm intelligence algorithms (such as ant colony or particle swarm optimization)[125] and evolutionary algorithms (such as genetic algorithms, gene expression programming, and genetic programming).[126]

Logic

Logic[127] is used for knowledge representation and problem solving, but it can be applied to other problems as well. For example, the satplan algorithm uses logic for planning[128] and inductive logic programming is a method for learning.[129]
Several different forms of logic are used in AI research. Propositional or sentential logic[130] is the logic of statements which can be true or false. First-order logic[131] also allows the use of quantifiers and predicates, and can express facts about objects, their properties, and their relations with each other. Fuzzy logic,[132] is a version of first-order logic which allows the truth of a statement to be represented as a value between 0 and 1, rather than simply True (1) or False (0). Fuzzy systems can be used for uncertain reasoning and have been widely used in modern industrial and consumer product control systems. Subjective logic[133] models uncertainty in a different and more explicit manner than fuzzy-logic: a given binomial opinion satisfies belief + disbelief + uncertainty = 1 within a Beta distribution. By this method, ignorance can be distinguished from probabilistic statements that an agent makes with high confidence.
Default logics, non-monotonic logics and circumscription[51] are forms of logic designed to help with default reasoning and the qualification problem. Several extensions of logic have been designed to handle specific domains of knowledge, such as: description logics;[45] situation calculus, event calculus and fluent calculus (for representing events and time);[46] causal calculus;[47] belief calculus; and modal logics.[48]

Probabilistic methods for uncertain reasoning

Many problems in AI (in reasoning, planning, learning, perception and robotics) require the agent to operate with incomplete or uncertain information. AI researchers have devised a number of powerful tools to solve these problems using methods from probability theory and economics.[134]
Bayesian networks[135] are a very general tool that can be used for a large number of problems: reasoning (using the Bayesian inference algorithm),[136] learning (using the expectation-maximization algorithm),[137] planning (using decision networks)[138] and perception (using dynamic Bayesian networks).[139] Probabilistic algorithms can also be used for filtering, prediction, smoothing and finding explanations for streams of data, helping perception systems to analyze processes that occur over time (e.g., hidden Markov models or Kalman filters).[139]
A key concept from the science of economics is "utility": a measure of how valuable something is to an intelligent agent. Precise mathematical tools have been developed that analyze how an agent can make choices and plan, using decision theory, decision analysis,[140] and information value theory.[57] These tools include models such as Markov decision processes,[141] dynamic decision networks,[139] game theory and mechanism design.[142]

Classifiers and statistical learning methods

The simplest AI applications can be divided into two types: classifiers ("if shiny then diamond") and controllers ("if shiny then pick up"). Controllers do, however, also classify conditions before inferring actions, and therefore classification forms a central part of many AI systems. Classifiers are functions that use pattern matching to determine a closest match. They can be tuned according to examples, making them very attractive for use in AI. These examples are known as observations or patterns. In supervised learning, each pattern belongs to a certain predefined class. A class can be seen as a decision that has to be made. All the observations combined with their class labels are known as a data set. When a new observation is received, that observation is classified based on previous experience.[143]
A classifier can be trained in various ways; there are many statistical and machine learning approaches. The most widely used classifiers are the neural network,[144] kernel methods such as the support vector machine,[145] k-nearest neighbor algorithm,[146] Gaussian mixture model,[147] naive Bayes classifier,[148] and decision tree.[149] The performance of these classifiers have been compared over a wide range of tasks. Classifier performance depends greatly on the characteristics of the data to be classified. There is no single classifier that works best on all given problems; this is also referred to as the "no free lunch" theorem. Determining a suitable classifier for a given problem is still more an art than science.[150]

Neural networks

A neural network is an interconnected group of nodes, akin to the vast network of neurons in the human brain.
The study of artificial neural networks[144] began in the decade before the field of AI research was founded, in the work of Walter Pitts and Warren McCullough. Other important early researchers were Frank Rosenblatt, who invented the perceptron and Paul Werbos who developed the backpropagation algorithm.[151]
The main categories of networks are acyclic or feedforward neural networks (where the signal passes in only one direction) and recurrent neural networks (which allow feedback). Among the most popular feedforward networks are perceptrons, multi-layer perceptrons and radial basis networks.[152] Among recurrent networks, the most famous is the Hopfield net, a form of attractor network, which was first described by John Hopfield in 1982.[153] Neural networks can be applied to the problem of intelligent control (for robotics) or learning, using such techniques as Hebbian learning and competitive learning.[154]
Hierarchical temporal memory is an approach that models some of the structural and algorithmic properties of the neocortex.[155] The term "deep learning" gained traction in the mid-2000s after a publication by Geoffrey Hinton and Ruslan Salakhutdinov showed how a many-layered feedforward neural network could be effectively pre-trained one layer at a time, treating each layer in turn as an unsupervised restricted Boltzmann machine, then using supervised backpropagation for fine-tuning.[156]

Deep neural networks

A deep neural network is an artificial neural network with multiple hidden layers of units between the input and output layers. Similar to shallow artificial neural networks, deep neural networks can model complex non-linear relationships. Over the last few years, advances in both machine learning algorithms and computer hardware have led to more efficient methods for training deep neural networks that contain many layers of non-linear hidden units and a very large output layer.[157]

Control theory

Main article: Intelligent control
Control theory, the grandchild of cybernetics, has many important applications, especially in robotics.[158]

Languages

AI researchers have developed several specialized languages for AI research, including Lisp[159] and Prolog.[160]

Evaluating progress

In 1950, Alan Turing proposed a general procedure to test the intelligence of an agent now known as the Turing test. This procedure allows almost all the major problems of artificial intelligence to be tested. However, it is a very difficult challenge and at present all agents fail.[161]
Artificial intelligence can also be evaluated on specific problems such as small problems in chemistry, hand-writing recognition and game-playing. Such tests have been termed subject matter expert Turing tests. Smaller problems provide more achievable goals and there are an ever-increasing number of positive results.[162]
One classification for outcomes of an AI test is:[163]
  1. Optimal: it is not possible to perform better.
  2. Strong super-human: performs better than all humans.
  3. Super-human: performs better than most humans.
  4. Sub-human: performs worse than most humans.
For example, performance at draughts (i.e. checkers) is optimal,[164] performance at chess is super-human and nearing strong super-human (see computer chess: computers versus human) and performance at many everyday tasks (such as recognizing a face or crossing a room without bumping into something) is sub-human.
A quite different approach measures machine intelligence through tests which are developed from mathematical definitions of intelligence. Examples of these kinds of tests start in the late nineties devising intelligence tests using notions from Kolmogorov complexity and data compression.[165] Two major advantages of mathematical definitions are their applicability to nonhuman intelligences and their absence of a requirement for human testers.
A derivative of the Turing test is the Completely Automated Public Turing test to tell Computers and Humans Apart (CAPTCHA). As the name implies, this helps to determine that a user is an actual person and not a computer posing as a human. In contrast to the standard Turing test, CAPTCHA administered by a machine and targeted to a human as opposed to being administered by a human and targeted to a machine. A computer asks a user to complete a simple test then generates a grade for that test. Computers are unable to solve the problem, so correct solutions are deemed to be the result of a person taking the test. A common type of CAPTCHA is the test that requires the typing of distorted letters, numbers or symbols that appear in an image undecipherable by a computer.[166]

Applications

An automated online assistant providing customer service on a web page – one of many very primitive applications of artificial intelligence.
Artificial intelligence techniques are pervasive and are too numerous to list. Frequently, when a technique reaches mainstream use, it is no longer considered artificial intelligence; this phenomenon is described as the AI effect.[167] An area that artificial intelligence has contributed greatly to is intrusion detection.[168]

Cancer Research

Artificial intelligence technology is being applied to complex problems like finding trends in cancer research.[169]

Competitions and prizes

There are a number of competitions and prizes to promote research in artificial intelligence. The main areas promoted are: general machine intelligence, conversational behavior, data-mining, robotic cars, robot soccer and games.

Platforms

A platform (or "computing platform") is defined as "some sort of hardware architecture or software framework (including application frameworks), that allows software to run." As Rodney Brooks pointed out many years ago,[170] it is not just the artificial intelligence software that defines the AI features of the platform, but rather the actual platform itself that affects the AI that results, i.e., there needs to be work in AI problems on real-world platforms rather than in isolation.
A wide variety of platforms has allowed different aspects of AI to develop, ranging from expert systems such as Cyc to deep-learning frameworks to robot platforms such as the Roomba with open interface.[171] Recent advances in deep artificial neural networks and distributed computing have led to a proliferation of software libraries, including Deeplearning4j, TensorFlow, Theano and Torch.
A technology startup called Vicarious has come up with software that works like a human brain in one key way: it can crack CAPTCHAs,the strings of tilted,squiggly letters that websites employ to make users “prove you are human,” as Yahoo! and others put it.[172][173]

Toys

AIBO, the first robotic pet, grew out of Sony's Computer Science Laboratory (CSL). Famed engineer Toshitada Doi is credited as AIBO's original progenitor: in 1994 he had started work on robots with artificial intelligence expert Masahiro Fujita, at CSL. Doi's friend, the artist Hajime Sorayama, was enlisted to create the initial designs for the AIBO's body. Those designs are now part of the permanent collections of Museum of Modern Art and the Smithsonian Institution, with later versions of AIBO being used in studies in Carnegie Mellon University. In 2006, AIBO was added into Carnegie Mellon University's "Robot Hall of Fame".

Personal Helper

Mark Zuckerberg, founder of Facebook Inc., announced on January 3, 2016 via his Facebook page, that his personal challenge for 2016 would be to build "a simple AI" to help him with work and to help run his home, similar to J.A.R.V.I.S. from the Iron Man films.[174] Some of the tasks that Zuckerberg would like his AI to assist with include adjusting room temperature, adjusting lighting, anticipating needs, and monitoring his newborn daughter Maxima Chan Zuckerberg.[175] Zuckerberg also hopes that his AI will feature and use voice and face recognition technologies (which have already been successfully implemented in the technology of Facebook).[176] He plans to advance the current technology of artificial intelligence, which is good at recognizing patterns, by teaching "common sense," through an approach called supervised learning.[174] Zuckerberg does not expect to have the AI built within the 2016 year, but is "glad to be joining the effort" that is pushing the field of AI forward.[174]

Philosophy and ethics

There are three philosophical questions related to AI:
  1. Is artificial general intelligence possible? Can a machine solve any problem that a human being can solve using intelligence? Or are there hard limits to what a machine can accomplish?
  2. Are intelligent machines dangerous? How can we ensure that machines behave ethically and that they are used ethically?
  3. Can a machine have a mind, consciousness and mental states in exactly the same sense that human beings do? Can a machine be sentient, and thus deserve certain rights? Can a machine intentionally cause harm?

The limits of artificial general intelligence

Can a machine be intelligent? Can it "think"?
Turing's "polite convention"
We need not decide if a machine can "think"; we need only decide if a machine can act as intelligently as a human being. This approach to the philosophical problems associated with artificial intelligence forms the basis of the Turing test.[161]
The Dartmouth proposal
"Every aspect of learning or any other feature of intelligence can be so precisely described that a machine can be made to simulate it." This conjecture was printed in the proposal for the Dartmouth Conference of 1956, and represents the position of most working AI researchers.[177]
Newell and Simon's physical symbol system hypothesis
"A physical symbol system has the necessary and sufficient means of general intelligent action." Newell and Simon argue that intelligence consists of formal operations on symbols.[178] Hubert Dreyfus argued that, on the contrary, human expertise depends on unconscious instinct rather than conscious symbol manipulation and on having a "feel" for the situation rather than explicit symbolic knowledge. (See Dreyfus' critique of AI.)[179][180]
Gödelian arguments
Gödel himself,[181] John Lucas (in 1961) and Roger Penrose (in a more detailed argument from 1989 onwards) argued that humans are not reducible to Turing machines.[182] The detailed arguments are complex, but in essence they derive from Kurt Gödel's 1931 proof in his first incompleteness theorem that it is always possible to create statements that a formal system could not prove. A human being, however, can (with some thought) see the truth of these "Gödel statements". Any Turing program designed to search for these statements can have its methods reduced to a formal system, and so will always have a "Gödel statement" derivable from its program which it can never discover. However, if humans are indeed capable of understanding mathematical truth, it doesn't seem possible that we could be limited in the same way. This is quite a general result, if accepted, since it can be shown that hardware neural nets, and computers based on random processes (e.g. annealing approaches) and quantum computers based on entangled qubits (so long as they involve no new physics) can all be reduced to Turing machines. All they do is reduce the complexity of the tasks, not permit new types of problems to be solved. Roger Penrose speculates that there may be new physics involved in our brain, perhaps at the intersection of gravity and quantum mechanics at the Planck scale. This argument, if accepted does not rule out the possibility of true artificial intelligence, but means it has to be biological in basis or based on new physical principles. The argument has been followed up by many counter arguments, and then Roger Penrose has replied to those with counter counter examples, and it is now an intricate complex debate.[183] For details see Philosophy of artificial intelligence: Lucas, Penrose and Gödel
The artificial brain argument
The brain can be simulated by machines and because brains are intelligent, simulated brains must also be intelligent; thus machines can be intelligent. Hans Moravec, Ray Kurzweil and others have argued that it is technologically feasible to copy the brain directly into hardware and software, and that such a simulation will be essentially identical to the original.[91]
The AI effect
Machines are already intelligent, but observers have failed to recognize it. When Deep Blue beat Garry Kasparov in chess, the machine was acting intelligently. However, onlookers commonly discount the behavior of an artificial intelligence program by arguing that it is not "real" intelligence after all; thus "real" intelligence is whatever intelligent behavior people can do that machines still can not. This is known as the AI Effect: "AI is whatever hasn't been done yet."

Intelligent behaviour and machine ethics

As a minimum, an AI system must be able to reproduce aspects of human intelligence. This raises the issue of how ethically the machine should behave towards both humans and other AI agents. This issue was addressed by Wendell Wallach in his book titled Moral Machines in which he introduced the concept of artificial moral agents (AMA).[184] For Wallach, AMAs have become a part of the research landscape of artificial intelligence as guided by its two central questions which he identifies as "Does Humanity Want Computers Making Moral Decisions"[185] and "Can (Ro)bots Really Be Moral".[186] For Wallach the question is not centered on the issue of whether machines can demonstrate the equivalent of moral behavior in contrast to the constraints which society may place on the development of AMAs.[187]

Machine ethics

Main article: Machine ethics
The field of machine ethics is concerned with giving machines ethical principles, or a procedure for discovering a way to resolve the ethical dilemmas they might encounter, enabling them to function in an ethically responsible manner through their own ethical decision making.[188] The field was delineated in the AAAI Fall 2005 Symposium on Machine Ethics: "Past research concerning the relationship between technology and ethics has largely focused on responsible and irresponsible use of technology by human beings, with a few people being interested in how human beings ought to treat machines. In all cases, only human beings have engaged in ethical reasoning. The time has come for adding an ethical dimension to at least some machines. Recognition of the ethical ramifications of behavior involving machines, as well as recent and potential developments in machine autonomy, necessitate this. In contrast to computer hacking, software property issues, privacy issues and other topics normally ascribed to computer ethics, machine ethics is concerned with the behavior of machines towards human users and other machines. Research in machine ethics is key to alleviating concerns with autonomous systems — it could be argued that the notion of autonomous machines without such a dimension is at the root of all fear concerning machine intelligence. Further, investigation of machine ethics could enable the discovery of problems with current ethical theories, advancing our thinking about Ethics."[189] Machine ethics is sometimes referred to as machine morality, computational ethics or computational morality. A variety of perspectives of this nascent field can be found in the collected edition "Machine Ethics" [188] that stems from the AAAI Fall 2005 Symposium on Machine Ethics.[189]

Malevolent and friendly AI

Main article: Friendly AI
Political scientist Charles T. Rubin believes that AI can be neither designed nor guaranteed to be benevolent.[190] He argues that "any sufficiently advanced benevolence may be indistinguishable from malevolence." Humans should not assume machines or robots would treat us favorably, because there is no a priori reason to believe that they would be sympathetic to our system of morality, which has evolved along with our particular biology (which AIs would not share). Hyper-intelligent software may not necessarily decide to support the continued existence of mankind, and would be extremely difficult to stop. This topic has also recently begun to be discussed in academic publications as a real source of risks to civilization, humans, and planet Earth.
Physicist Stephen Hawking, Microsoft founder Bill Gates and SpaceX founder Elon Musk have expressed concerns about the possibility that AI could evolve to the point that humans could not control it, with Hawking theorizing that this could "spell the end of the human race".[191]
One proposal to deal with this is to ensure that the first generally intelligent AI is 'Friendly AI', and will then be able to control subsequently developed AIs. Some question whether this kind of check could really remain in place.
Leading AI researcher Rodney Brooks writes, "I think it is a mistake to be worrying about us developing malevolent AI anytime in the next few hundred years. I think the worry stems from a fundamental error in not distinguishing the difference between the very real recent advances in a particular aspect of AI, and the enormity and complexity of building sentient volitional intelligence."[192]

Devaluation of humanity

Joseph Weizenbaum wrote that AI applications can not, by definition, successfully simulate genuine human empathy and that the use of AI technology in fields such as customer service or psychotherapy[193] was deeply misguided. Weizenbaum was also bothered that AI researchers (and some philosophers) were willing to view the human mind as nothing more than a computer program (a position now known as computationalism). To Weizenbaum these points suggest that AI research devalues human life.[194]

Decrease in demand for human labor

Martin Ford, author of The Lights in the Tunnel: Automation, Accelerating Technology and the Economy of the Future,[195] and others argue that specialized artificial intelligence applications, robotics and other forms of automation will ultimately result in significant unemployment as machines begin to match and exceed the capability of workers to perform most routine and repetitive jobs. Ford predicts that many knowledge-based occupations—and in particular entry level jobs—will be increasingly susceptible to automation via expert systems, machine learning[196] and other AI-enhanced applications. AI-based applications may also be used to amplify the capabilities of low-wage offshore workers, making it more feasible to outsource knowledge work.[197]

Machine consciousness, sentience and mind

If an AI system replicates all key aspects of human intelligence, will that system also be sentient – will it have a mind which has conscious experiences? This question is closely related to the philosophical problem as to the nature of human consciousness, generally referred to as the hard problem of consciousness.

Consciousness

Computationalism

Computationalism is the position in the philosophy of mind that the human mind or the human brain (or both) is an information processing system and that thinking is a form of computing.[198] Computationalism argues that the relationship between mind and body is similar or identical to the relationship between software and hardware and thus may be a solution to the mind-body problem. This philosophical position was inspired by the work of AI researchers and cognitive scientists in the 1960s and was originally proposed by philosophers Jerry Fodor and Hillary Putnam.

Strong AI hypothesis

Main article: Chinese room
Searle's strong AI hypothesis states that "The appropriately programmed computer with the right inputs and outputs would thereby have a mind in exactly the same sense human beings have minds."[199] John Searle counters this assertion with his Chinese room argument, which asks us to look inside the computer and try to find where the "mind" might be.[200]

Robot rights

Main article: Robot rights
Mary Shelley's Frankenstein considers a key issue in the ethics of artificial intelligence: if a machine can be created that has intelligence, could it also feel? If it can feel, does it have the same rights as a human? The idea also appears in modern science fiction, such as the film A.I.: Artificial Intelligence, in which humanoid machines have the ability to feel emotions. This issue, now known as "robot rights", is currently being considered by, for example, California's Institute for the Future, although many critics believe that the discussion is premature.[201] The subject is profoundly discussed in the 2010 documentary film Plug & Pray.[202]

Superintelligence

Main article: Superintelligence
Are there limits to how intelligent machines – or human-machine hybrids – can be? A superintelligence, hyperintelligence, or superhuman intelligence is a hypothetical agent that would possess intelligence far surpassing that of the brightest and most gifted human mind. ‘’Superintelligence’’ may also refer to the form or degree of intelligence possessed by such an agent.

Technological singularity

If research into Strong AI produced sufficiently intelligent software, it might be able to reprogram and improve itself. The improved software would be even better at improving itself, leading to recursive self-improvement.[203] The new intelligence could thus increase exponentially and dramatically surpass humans. Science fiction writer Vernor Vinge named this scenario "singularity".[204] Technological singularity is when accelerating progress in technologies will cause a runaway effect wherein artificial intelligence will exceed human intellectual capacity and control, thus radically changing or even ending civilization. Because the capabilities of such an intelligence may be impossible to comprehend, the technological singularity is an occurrence beyond which events are unpredictable or even unfathomable.[204]
Ray Kurzweil has used Moore's law (which describes the relentless exponential improvement in digital technology) to calculate that desktop computers will have the same processing power as human brains by the year 2029, and predicts that the singularity will occur in 2045.[204]

Transhumanism

Main article: Transhumanism
You awake one morning to find your brain has another lobe functioning. Invisible, this auxiliary lobe answers your questions with information beyond the realm of your own memory, suggests plausible courses of action, and asks questions that help bring out relevant facts. You quickly come to rely on the new lobe so much that you stop wondering how it works. You just use it. This is the dream of artificial intelligence.
— BYTE, April 1985[205]
Robot designer Hans Moravec, cyberneticist Kevin Warwick and inventor Ray Kurzweil have predicted that humans and machines will merge in the future into cyborgs that are more capable and powerful than either.[206] This idea, called transhumanism, which has roots in Aldous Huxley and Robert Ettinger, has been illustrated in fiction as well, for example in the manga Ghost in the Shell and the science-fiction series Dune.
In the 1980s artist Hajime Sorayama's Sexy Robots series were painted and published in Japan depicting the actual organic human form with lifelike muscular metallic skins and later "the Gynoids" book followed that was used by or influenced movie makers including George Lucas and other creatives. Sorayama never considered these organic robots to be real part of nature but always unnatural product of the human mind, a fantasy existing in the mind even when realized in actual form.
Edward Fredkin argues that "artificial intelligence is the next stage in evolution", an idea first proposed by Samuel Butler's "Darwin among the Machines" (1863), and expanded upon by George Dyson in his book of the same name in 1998.[207]

Existential risk

"The development of full artificial intelligence could spell the end of the human race." -Stephen Hawking[208]
A common concern about the development of artificial intelligence is the potential threat it could pose to mankind. This concern has recently gained attention after mentions by celebrities including Stephen Hawking, Bill Gates,[209] and Elon Musk.[210] The opinion of experts within the field of artificial intelligence is mixed, with sizable fractions both concerned and unconcerned by risk from eventual superhumanly-capable AI.[211]
In his book Superintelligence, Nick Bostrom provides an argument that artificial intelligence will pose a threat to mankind. He argues that sufficiently intelligent AI, if it chooses actions based on achieving some goal, will exhibit convergent behavior such as acquiring resources or protecting itself from being shut down. If this AI's goals do not reflect humanity's - one example is an AI told to compute as many digits of Pi as possible - it might harm humanity in order to acquire more resources or prevent itself from being shut down, ultimately to better achieve its goal.
For this danger to be realized, the hypothetical AI would have to overpower or out-think all of humanity, which a minority of experts argue is a possibility far enough in the future to not be worth researching.[212][213] Other counterarguments revolve around humans being either intrinsically or convergently valuable from the perspective of an artificial intelligence.[214]
Concern over risk from artificial intelligence has led to some high-profile donations and investments. In January 2015, Elon Musk donated ten million dollars to the Future of Life Institute to fund research on understanding AI decision making. The goal of the institute is to "grow wisdom with which we manage" the growing power of technology. Musk also funds companies developing artificial intelligence such as Google DeepMind and Vicarious to “just keep an eye on what’s going on with artificial intelligence.[215] I think there is potentially a dangerous outcome there.”[216][217]
Development of militarized artificial intelligence is a related concern. Currently, 50 countries are researching battlefield robots, including the United States, China, Russia, and the United Kingdom. Many people concerned about risk from superintelligent AI also want to limit the use of artificial soldiers.[218]

In fiction

The implications of artificial intelligence have been a persistent theme in science fiction. Early stories typically revolved around intelligent robots. The word "robot" itself was coined by Karel Čapek in his 1921 play R.U.R., the title standing for "Rossum's Universal Robots". Later, the SF writer Isaac Asimov developed the Three Laws of Robotics which he subsequently explored in a long series of robot stories. These laws have since gained some traction in genuine AI research.
Other influential fictional intelligences include HAL, the computer in charge of the spaceship in 2001: A Space Odyssey, released as both a film and a book in 1968 and written by Arthur C. Clarke.
Since then, AI has become firmly rooted in popular culture.

Notes

  1. Definition of AI as the study of intelligent agents:
  2. The intelligent agent paradigm: The definition used in this article, in terms of goals, actions, perception and environment, is due to Russell & Norvig (2003). Other definitions also include knowledge and learning as additional criteria.
  3. Although there is some controversy on this point (see Crevier (1993, p. 50)), McCarthy states unequivocally "I came up with the term" in a c|net interview. (Skillings 2006) McCarthy first used the term in the proposal for the Dartmouth conference, which appeared in 1955. (McCarthy et al. 1955)
  4. McCarthy's definition of AI:
  5. Pamela McCorduck (2004, pp. 424) writes of "the rough shattering of AI in subfields—vision, natural language, decision theory, genetic algorithms, robotics ... and these with own sub-subfield—that would hardly have anything to say to each other."
  6. This list of intelligent traits is based on the topics covered by the major AI textbooks, including:
  7. General intelligence (strong AI) is discussed in popular introductions to AI:
  8. See the Dartmouth proposal, under Philosophy, below.
  9. This is a central idea of Pamela McCorduck's Machines Who Think. She writes: "I like to think of artificial intelligence as the scientific apotheosis of a venerable cultural tradition." (McCorduck 2004, p. 34) "Artificial intelligence in one form or another is an idea that has pervaded Western intellectual history, a dream in urgent need of being realized." (McCorduck 2004, p. xviii) "Our history is full of attempts—nutty, eerie, comical, earnest, legendary and real—to make artificial intelligences, to reproduce what is the essential us—bypassing the ordinary means. Back and forth between myth and reality, our imaginations supplying what our workshops couldn't, we have engaged for a long time in this odd form of self-reproduction." (McCorduck 2004, p. 3) She traces the desire back to its Hellenistic roots and calls it the urge to "forge the Gods." (McCorduck 2004, pp. 340–400)
  10. The optimism referred to includes the predictions of early AI researchers (see optimism in the history of AI) as well as the ideas of modern transhumanists such as Ray Kurzweil.
  11. The "setbacks" referred to include the ALPAC report of 1966, the abandonment of perceptrons in 1970, the Lighthill Report of 1973 and the collapse of the Lisp machine market in 1987.
  12. AI applications widely used behind the scenes:
  13. AI in myth:
  14. Cult images as artificial intelligence: These were the first machines to be believed to have true intelligence and consciousness. Hermes Trismegistus expressed the common belief that with these statues, craftsman had reproduced "the true nature of the gods", their sensus and spiritus. McCorduck makes the connection between sacred automatons and Mosaic law (developed around the same time), which expressly forbids the worship of robots (McCorduck 2004, pp. 6–9)
  15. "A Thirteenth Century Programmable Robot". Shef.ac.uk. Archived from the original on 29 June 2009. Retrieved 25 April 2009. Wolfgang von Kempelen:
  16. Artificial beings:
    Jābir ibn Hayyān's Takwin:
    Judah Loew's Golem: Paracelsus' Homunculus:
  17. AI in early science fiction.
  18. This insight, that digital computers can simulate any process of formal reasoning, is known as the Church–Turing thesis.
  19. Formal reasoning:
  20. AI's immediate precursors:
  21. Dartmouth conference:
    • McCorduck 2004, pp. 111–136
    • Crevier 1993, pp. 47–49, who writes "the conference is generally recognized as the official birthdate of the new science."
    • Russell & Norvig 2003, p. 17, who call the conference "the birth of artificial intelligence."
    • NRC 1999, pp. 200–201
  22. Hegemony of the Dartmouth conference attendees:
  23. Russell and Norvig write "it was astonishing whenever a computer did anything kind of smartish." Russell & Norvig 2003, p. 18
  24. "Golden years" of AI (successful symbolic reasoning programs 1956–1973): The programs described are Arthur Samuel's checkers program for the IBM 701, Daniel Bobrow's STUDENT, Newell and Simon's Logic Theorist and Terry Winograd's SHRDLU.
  25. DARPA pours money into undirected pure research into AI during the 1960s:
  26. AI in England:
  27. Optimism of early AI:
  28. See The problems (in History of artificial intelligence)
  29. Lighthill 1973.
  30. First AI Winter, Mansfield Amendment, Lighthill report
  31. Expert systems:
  32. Boom of the 1980s: rise of expert systems, Fifth Generation Project, Alvey, MCC, SCI:
  33. Second AI winter:
  34. Formal methods are now preferred ("Victory of the neats"):
  35. McCorduck 2004, pp. 480–483
  36. Markoff 2011.
  37. Administrator. "Kinect's AI breakthrough explained". i-programmer.info.
  38. http://readwrite.com/2013/01/15/virtual-personal-assistants-the-future-of-your-smartphone-infographic
  39. Problem solving, puzzle solving, game playing and deduction:
  40. Uncertain reasoning:
  41. Intractability and efficiency and the combinatorial explosion:
  42. Psychological evidence of sub-symbolic reasoning:
  43. Knowledge representation:
  44. Knowledge engineering:
  45. Representing categories and relations: Semantic networks, description logics, inheritance (including frames and scripts):
  46. Representing events and time:Situation calculus, event calculus, fluent calculus (including solving the frame problem):
  47. Causal calculus:
  48. Representing knowledge about knowledge: Belief calculus, modal logics:
  49. Ontology:
  50. Qualification problem: While McCarthy was primarily concerned with issues in the logical representation of actions, Russell & Norvig 2003 apply the term to the more general issue of default reasoning in the vast network of assumptions underlying all our commonsense knowledge.
  51. Default reasoning and default logic, non-monotonic logics, circumscription, closed world assumption, abduction (Poole et al. places abduction under "default reasoning". Luger et al. places this under "uncertain reasoning"):
  52. Breadth of commonsense knowledge:
  53. Dreyfus & Dreyfus 1986
  54. Gladwell 2005
  55. Expert knowledge as embodied intuition:
  56. Planning:
  57. Information value theory:
  58. Classical planning:
  59. Planning and acting in non-deterministic domains: conditional planning, execution monitoring, replanning and continuous planning:
  60. Multi-agent planning and emergent behavior:
  61. This is a form of Tom Mitchell's widely quoted definition of machine learning: "A computer program is set to learn from an experience E with respect to some task T and some performance measure P if its performance on T as measured by P improves with experience E."
  62. Learning:
  63. Alan Turing discussed the centrality of learning as early as 1950, in his classic paper "Computing Machinery and Intelligence".(Turing 1950) In 1956, at the original Dartmouth AI summer conference, Ray Solomonoff wrote a report on unsupervised probabilistic machine learning: "An Inductive Inference Machine".(Solomonoff 1956)
  64. Reinforcement learning:
  65. Computational learning theory:
  66. Weng et al. 2001.
  67. Lungarella et al. 2003.
  68. Asada et al. 2009.
  69. Oudeyer 2010.
  70. Natural language processing:
  71. "Versatile question answering systems: seeing in synthesis", Mittal et al., IJIIDS, 5(2), 119-142, 2011
  72. Applications of natural language processing, including information retrieval (i.e. text mining) and machine translation:
  73. Machine perception:
  74. Computer vision:
  75. Speech recognition:
  76. Object recognition:
  77. Robotics:
  78. Moving and configuration space:
  79. Tecuci 2012.
  80. Robotic mapping (localization, etc):
  81. Kismet.
  82. Thro 1993.
  83. Edelson 1991.
  84. Tao & Tan 2005.
  85. James 1884.
  86. Picard 1995.
  87. Kleine-Cosack 2006: "The introduction of emotion to computer science was done by Pickard (sic) who created the field of affective computing."
  88. Diamond 2003: "Rosalind Picard, a genial MIT professor, is the field's godmother; her 1997 book, Affective Computing, triggered an explosion of interest in the emotional side of computers and their users."
  89. Emotion and affective computing:
  90. Gerald Edelman, Igor Aleksander and others have argued that artificial consciousness is required for strong AI. (Aleksander 1995; Edelman 2007)
  91. Artificial brain arguments: AI requires a simulation of the operation of the human brain A few of the people who make some form of the argument: The most extreme form of this argument (the brain replacement scenario) was put forward by Clark Glymour in the mid-1970s and was touched on by Zenon Pylyshyn and John Searle in 1980.
  92. AI complete: Shapiro 1992, p. 9
  93. Nils Nilsson writes: "Simply put, there is wide disagreement in the field about what AI is all about" (Nilsson 1983, p. 10).
  94. Biological intelligence vs. intelligence in general:
    • Russell & Norvig 2003, pp. 2–3, who make the analogy with aeronautical engineering.
    • McCorduck 2004, pp. 100–101, who writes that there are "two major branches of artificial intelligence: one aimed at producing intelligent behavior regardless of how it was accomplioshed, and the other aimed at modeling intelligent processes found in nature, particularly human ones."
    • Kolata 1982, a paper in Science, which describes McCarthy's indifference to biological models. Kolata quotes McCarthy as writing: "This is AI, so we don't care if it's psychologically real"[1]. McCarthy recently reiterated his position at the AI@50 conference where he said "Artificial intelligence is not, by definition, simulation of human intelligence" (Maker 2006).
  95. Neats vs. scruffies:
  96. Symbolic vs. sub-symbolic AI:
  97. Haugeland 1985, p. 255.
  98. Law 1994.
  99. Bach 2008.
  100. Haugeland 1985, pp. 112–117
  101. The most dramatic case of sub-symbolic AI being pushed into the background was the devastating critique of perceptrons by Marvin Minsky and Seymour Papert in 1969. See History of AI, AI winter, or Frank Rosenblatt.
  102. Cognitive simulation, Newell and Simon, AI at CMU (then called Carnegie Tech):
  103. Soar (history):
  104. McCarthy and AI research at SAIL and SRI International:
  105. AI research at Edinburgh and in France, birth of Prolog:
  106. AI at MIT under Marvin Minsky in the 1960s :
  107. Cyc:
  108. Knowledge revolution:
  109. Embodied approaches to AI:
  110. Revival of connectionism:
  111. Computational intelligence
  112. Hutter 2012.
  113. Langley 2011.
  114. Katz 2012.
  115. Norvig 2012.
  116. Agent architectures, hybrid intelligent systems:
  117. Hierarchical control system:
  118. Subsumption architecture:
  119. Search algorithms:
  120. Forward chaining, backward chaining, Horn clauses, and logical deduction as search:
  121. State space search and planning:
  122. Uninformed searches (breadth first search, depth first search and general state space search):
  123. Heuristic or informed searches (e.g., greedy best first and A*):
  124. Optimization searches:
  125. Artificial life and society based learning:
  126. Genetic programming and genetic algorithms:
  127. Logic:
  128. Satplan:
  129. Explanation based learning, relevance based learning, inductive logic programming, case based reasoning:
  130. Propositional logic:
  131. First-order logic and features such as equality:
  132. Fuzzy logic:
  133. Subjective logic:
  134. Stochastic methods for uncertain reasoning:
  135. Bayesian networks:
  136. Bayesian inference algorithm:
  137. Bayesian learning and the expectation-maximization algorithm:
  138. Bayesian decision theory and Bayesian decision networks:
  139. Stochastic temporal models: Dynamic Bayesian networks: Hidden Markov model: Kalman filters:
  140. decision theory and decision analysis:
  141. Markov decision processes and dynamic decision networks:
  142. Game theory and mechanism design:
  143. Statistical learning methods and classifiers:
  144. Neural networks and connectionism:
  145. kernel methods such as the support vector machine:
  146. K-nearest neighbor algorithm:
  147. Gaussian mixture model:
  148. Naive Bayes classifier:
  149. Decision tree:
  150. Classifier performance:
  151. Backpropagation:
  152. Feedforward neural networks, perceptrons and radial basis networks:
  153. Recurrent neural networks, Hopfield nets:
  154. Competitive learning, Hebbian coincidence learning, Hopfield networks and attractor networks:
  155. Hierarchical temporal memory:
  156. Hinton 2007.
  157. Research, AI (23 October 2015). "Deep Neural Networks for Acoustic Modeling in Speech Recognition". airesearch.com. Retrieved 23 October 2015.
  158. Control theory:
  159. Lisp:
  160. Prolog:
  161. The Turing test:
    Turing's original publication:
    Historical influence and philosophical implications:
  162. Subject matter expert Turing test:
  163. Rajani 2011.
  164. Game AI:
  165. Mathematical definitions of intelligence:
  166. O'Brien & Marakas 2011.
  167. CNN 2006.
  168. Intrusion detection:
  169. LOHR, STEVE (28 February 2016). "The Promise of Artificial Intelligence Unfolds in Small Steps". New York Times. Retrieved 29 February 2016.
  170. Brooks 1991.
  171. "Hacking Roomba". hackingroomba.com.
  172. Bohannon, John (28 October 2013). "CAPTCHA Busted? AI Company Claims Break of Internet’s Favorite Protection System". Wired. Retrieved 16 February 2016.
  173. "Artificial intelligence: New software can break CAPTCHAs from Google,PayPal". The Indian Express. 28 October 2013. Retrieved 16 February 2016.
  174. "Mark Zuckerberg - My personal challenge for 2016 is to...". Facebook. Retrieved 2016-02-04.
  175. "Mark Zuckerberg Is Making His Own Personal AI Helper". Fortune. Retrieved 2016-02-04.
  176. Wattles, Jackie. "Mark Zuckerberg's 2016 goal: Code his own personal assistant". CNNMoney. Retrieved 2016-02-04.
  177. Dartmouth proposal:
  178. The physical symbol systems hypothesis:
  179. Dreyfus criticized the necessary condition of the physical symbol system hypothesis, which he called the "psychological assumption": "The mind can be viewed as a device operating on bits of information according to formal rules". (Dreyfus 1992, p. 156)
  180. Dreyfus' critique of artificial intelligence:
  181. Gödel 1951: in this lecture, Kurt Gödel uses the incompleteness theorem to arrive at the following disjunction: (a) the human mind is not a consistent finite machine, or (b) there exist Diophantine equations for which it cannot decide whether solutions exist. Gödel finds (b) implausible, and thus seems to have believed the human mind was not equivalent to a finite machine, i.e., its power exceeded that of any finite machine. He recognized that this was only a conjecture, since one could never disprove (b). Yet he considered the disjunctive conclusion to be a "certain fact".
  182. The Mathematical Objection: Making the Mathematical Objection: Refuting Mathematical Objection: Background:
    • Gödel 1931, Church 1936, Kleene 1935, Turing 1937
  183. Beyond the Doubting of a Shadow, A Reply to Commentaries on Shadows of the Mind, Roger Penrose 1996 The links to the original articles he responds to there are easily found in the Wayback machine: Can Physics Provide a Theory of Consciousness? Barnard J. Bars, Penrose's Gödelian Argument etc.
  184. Wendell Wallach (2010). Moral Machines, Oxford University Press.
  185. Wallach, pp 37–54.
  186. Wallach, pp 55–73.
  187. Wallach, Introduction chapter.
  188. Michael Anderson and Susan Leigh Anderson (2011), Machine Ethics, Cambridge University Press.
  189. "Machine Ethics". aaai.org.
  190. Rubin, Charles (Spring 2003). "Artificial Intelligence and Human Nature". The New Atlantis 1: 88–100.
  191. Rawlinson, Kevin. "Microsoft's Bill Gates insists AI is a threat". BBC News. Retrieved 30 January 2015.
  192. Brooks, Rodney (10 November 2014). "artificial intelligence is a tool, not a threat".
  193. In the early 1970s, Kenneth Colby presented a version of Weizenbaum's ELIZA known as DOCTOR which he promoted as a serious therapeutic tool. (Crevier 1993, pp. 132–144)
  194. Joseph Weizenbaum's critique of AI: Weizenbaum (the AI researcher who developed the first chatterbot program, ELIZA) argued in 1976 that the misuse of artificial intelligence has the potential to devalue human life.
  195. Ford, Martin R. (2009), The Lights in the Tunnel: Automation, Accelerating Technology and the Economy of the Future, Acculant Publishing, ISBN 978-1448659814. (e-book available free online.)
  196. "Machine Learning: A job killer?". econfuture - Robots, AI and Unemployment - Future Economics and Technology.
  197. AI could decrease the demand for human labor:
  198. Horst, Steven, (2005) "The Computational Theory of Mind" in The Stanford Encyclopedia of Philosophy
  199. This version is from Searle (1999), and is also quoted in Dennett 1991, p. 435. Searle's original formulation was "The appropriately programmed computer really is a mind, in the sense that computers given the right programs can be literally said to understand and have other cognitive states." (Searle 1980, p. 1). Strong AI is defined similarly by Russell & Norvig (2003, p. 947): "The assertion that machines could possibly act intelligently (or, perhaps better, act as if they were intelligent) is called the 'weak AI' hypothesis by philosophers, and the assertion that machines that do so are actually thinking (as opposed to simulating thinking) is called the 'strong AI' hypothesis."
  200. Searle's Chinese room argument: Discussion:
  201. Robot rights: Prematurity of: In fiction:
  202. maschafilm. "Content: Plug & Pray Film - Artificial Intelligence - Robots -". plugandpray-film.de.
  203. Omohundro, Steve (2008). The Nature of Self-Improving Artificial Intelligence. presented and distributed at the 2007 Singularity Summit, San Francisco, CA.
  204. Technological singularity:
  205. Lemmons, Phil (April 1985). "Artificial Intelligence". BYTE. p. 125. Retrieved 14 February 2015.
  206. Transhumanism:
  207. AI as evolution:
  208. "Stephen Hawking warns artificial intelligence could end mankind - BBC News". BBC News. Retrieved 2015-10-30.
  209. Holley, Peter (2015-01-28). "Bill Gates on dangers of artificial intelligence: ‘I don’t understand why some people are not concerned’". The Washington Post. ISSN 0190-8286. Retrieved 2015-10-30.
  210. Gibbs, Samuel. "Elon Musk: artificial intelligence is our biggest existential threat". the Guardian. Retrieved 2015-10-30.
  211. Müller, Vincent C.; Bostrom, Nick (2014). "Future Progress in Artificial Intelligence: A Poll Among Experts" (PDF). AI Matters 1 (1): 9. doi:10.1145/2639475.2639478.
  212. "Is artificial intelligence really an existential threat to humanity?". Bulletin of the Atomic Scientists. Retrieved 2015-10-30.
  213. "The case against killer robots, from a guy actually working on artificial intelligence". Fusion.net. Retrieved 2016-01-31.
  214. "Will artificial intelligence destroy humanity? Here are 5 reasons not to worry.". Vox. Retrieved 2015-10-30.
  215. "The mysterious artificial intelligence company Elon Musk invested in is developing game-changing smart computers". Tech Insider. Retrieved 2015-10-30.
  216. Clark, Jack. "Musk-Backed Group Probes Risks Behind Artificial Intelligence". Bloomberg.com. Retrieved 2015-10-30.
  217. "Elon Musk Is Donating $10M Of His Own Money To Artificial Intelligence Research". Fast Company. Retrieved 2015-10-30.
  218. "Stephen Hawking, Elon Musk, and Bill Gates Warn About Artificial Intelligence". Observer. Retrieved 2015-10-30.

References

AI textbooks

History of AI

Other sources

Further reading

External links

Phòng thí nghiệm khoa học máy tính và trí tuệ nhân tạo MIT theo Bách khoa toàn thư mở Wikipedia

Phòng thí nghiệm khoa học máy tính và trí tuệ nhân tạo MIT (CSAIL) là một phòng thí nghiệm nghiên cứu tại viện công nghệ Massachusetts thành lập bởi sự sát nhập vào năm 2003 của Phòng thí nghiệm Khoa học Máy tính và Phòng thí nghiệm Trí tuệ Nhân tạo. Nằm trong Trung tâm Stata, CSAIL là phòng thí nghiệm lớn nhất trong khuôn viên trường tính theo phạm vi nghiên cứu và tư cách thành viên.

Hoạt động nghiên cứu

Hoạt động nghiên cứu của CSAIL được tổ chức xung quanh một số nhóm nghiên cứu bán tự chủ, mỗi trong số đó được lãnh đạo bởi một hoặc nhiều giáo sư hoặc các nhà khoa học nghiên cứu. Các nhóm này được chia thành bảy lĩnh vực nghiên cứu chung:
Ngoài ra, CSAIL còn tổ chức World Wide Web Consortium (W3C).

Lịch sử

Nghiên cứu máy tính tại MIT bắt đầu với nghiên cứu của Vannevar Bush về mộtphân tích vi phânđại số Boole điện tử của Claude Shannon vào những năm 1930, trong thời gian chiến tranh phòng thí nghiệm bức xạ, sau chiến tranh Dự án Cơn lốc và phòng thí nghiệm nghiên cứu điện tử (RLE), và SAGE của phòng thí nghiệm Lincoln đầu những năm 1950.
Nghiên cứu tại MIT trong lĩnh vực trí tuệ nhân tạo bắt đầu vào năm 1959.[citation needed]

Dự án MAC

Ngày 1 tháng 7 năm 1963, dự án MAC (dự án về toán (Math) và tính toán (Computation), sau đó được đổi lại bằng cách ghép các từ như là máy tính đa truy cập (Multiple Access computer), máy tính hỗ trợ nhận thức (Machine Aided Cognitions), hoặc người và máy tính (Man and computer) đã được khởi động với một khoản trợ cấp 2 triệu Dolar Mỹ từ Cơ quan các dự án nghiên cứu phòng thủ nâng cao (DARPA-Defense Advanced Research Projects Agency). Giám đốc ban đầu của dự án MAC của  là Robert Fano của phòng thí nghiệm nghiên cứu điện tử (RLE) của MIT. Fano quyết định gọi MAC là một "dự án" chứ không phải là "phòng thí nghiệm" vì lý do chính trị nội bộ của MIT — nếu MAC đã được gọi là một phòng thí nghiệm, thì nó sẽ khó khăn hơn để tấn công các phòng ban khác của MIT để có được nhân sự nghiên cứu. Quản lý chương trình này phải chịu trách nhiệm đối với DARPA là J.C.R. Licklider, người trước đó đã tiến hành nghiên cứu tại RLE của MIT, và sau đó sẽ kế vị Fano làm giám đốc của dự án MAC.
Dự án MAC trở nên nổi tiếng về các nghiên cứu đột phá trong hệ điều hành, trí tuệ nhân tạo, và lý thuyết tính toán. Những cơ quan đương thời với nó bao gồm Dự án Genie tại Berkeley, phòng thí nghiệm trí tuệ nhân tạo Stanford, và (một chút sau này) là viện Khoa học Thông tin của trường đại học của Nam California (USC).
Một "nhóm AI" bao gồm Marvin Minsky (Giám đốc), John McCarthy (người phát minh ra Lisp) và một cộng đồng các lập trình viên máy tính tài năng được tích hợp vào dự án mới thành lập MAC. Nó quan tâm chủ yếu là các bài toán về thị giác máy tính, chuyển động và thao tác cơ khí, và ngôn ngữ, mà họ coi là các chìa khóa để máy móc thông minh hơn. Trong những thập niên 1950 – 1970, Nhóm AI chia sẻ một phòng máy tính với một máy tính (ban đầu là một máy tính PDP-6, và sau đó là một máy tính PDP-10) để họ xây dựng một hệ điều hành chia sẻ thời gian gọi là ITS.[citation needed]
Nhân sự dự án MAC đầu tiên bao gồm Fano, Minsky, Licklider, Fernando J. Corbató, và một cộng đồng lập trình viên máy tính và những người có đam mê khác, nhưng người đã truyền cảm hứng cho họ từ cựu đồng nghiệp John McCarthy. Những người sáng lập này hình dung ra việc tạo ra một thiết bị máy tính có sức mạnh tính toán đáng tin cậy như một thiết bị điện. Để đạt được điều này, Corbató đã mang hệ thống máy tính chia sẽ thời gian đầu tiên,CTSS theo ông từ Trung tâm tính toán MIT, bằng cách sử dụng kinh phí của DARPA để mua một máy IBM 7094 để phục vụ cho việc nghiên cứu. Một trong những tập trung ban đầu của dự án MAC là phát triển của một phiên bản kế thừa của CTSS, Multics, là hệ thống máy tính sẵn sàng cao đầu tiên, được phát triển như là một phần của một tập đoàn công nghiệp bao gồm General Electricphòng thí nghiệm Bell.
Năm 1966, Scientific American giới thiệu dự án MAC trong chuyên đề tháng Chín dành cho khoa học máy tính, sau đó được xuất bản thành sách. Lúc đó, Hệ thống được mô tả là có khoảng 100 TTY thiết bị đầu cuối, chủ yếu là trên khuôn viên trường, nhưng với một vài tại nhà riêng. Chỉ có 30 người dùng có thể được đăng nhập cùng một lúc. Dự án này tuyển sinh viên trong nhiều lớp học khác nhau để sử dụng các thiết bị đầu cuối đồng thời trong việc giải quyết bài toán, mô phỏng, và truyền thông nhiều đầu cuối khi các bài kiểm tra cho phầm mềm tính toán đa truy cập các phần mềm máy tính được phát triển.

LCS và phòng thí nghiệm AI

Trong cuối thập niên 1960, nhóm trí tuệ nhân tạo của Minsky đã tìm kiếm nhiều không gian hơn, và không thể có được sự hài lòng từ Giám đốc dự án Licklider. Vấn đề chính trị phân bổ không gian trong trường đại học chính là vấn đề, Minsky tìm thấy rằng mặc dù dự án MAC như một thực thể duy nhất có thể không nhận được thêm không gian ông muốn, ông có thể tách ra để tạo thành phòng thí nghiệm cho riêng mình và sau đó được hưởng thêm không gian văn phòng. Kết quả là, MIT AI Lab được thành lập vào năm 1970, và nhiều người trong số các đồng nghiệp AI của Minsky đã rời dự án MAC để tham gia với ông trong phòng thí nghiệm mới, trong khi hầu hết các thành viên còn lại đã tạo thành Phòng thí nghiệm Khoa học Máy tính. Những lập trình viên tài năng như Richard Stallman, người sử dụng TECO để viết EMACS, thứ phát triển mạnh mẽ trong các phòng thí nghiệm AI trong thời gian này.
Những nhà nghiên cứu này đã không tham gia phòng thí nghiệm AI nhỏ hơn tạo thành Phòng thí nghiệm Khoa học Máy tính và tiếp tục nghiên cứu của họ về hệ điều hành, ngôn ngữ lập trình, Hệ thống phân tánlý thuyết tính toán. Hai giáo sư, Hal Abelson và Gerald Jay Sussman, chọn nằm ở vị trí trì trung lập-nhóm của họ được gọi khác nhau như Thụy sĩ và dự án MAC trong 30 năm tới.[citation needed]
Các phòng thí nghiệm AI đã dẫn đến phát minh ra các máy Lisp và nỗ lực để thương mại hóa bởi hai công ty trong những năm 1980: SymbolicsLisp Machines Inc. Điều này chia phòng thí nghiệm AI thành các 'trại' và dẫn đến việc thôi việc nhiều nhân viên. Kinh nghiệm này đã ảnh hưởng lớn đến các công việc ủa Stallman sau đó trong dự án GNU. "Không ai đã hình dung ra rằng nhóm hacker này của phòng thí nghiệm AI đã bị xóa sổ, nhưng nó đã xãy ra."... "Đó là cơ sở cho phong trào phần mềm miễn phí — kinh nghiệm của tôi có, cuộc sống mà tôi đã sống tại Phòng thí nghiệm MIT AI — để nghiên cứu về kiến thức của con người, và không  hơn bằng cách sử dụng và tiếp tục phổ biến kiến thức của con người".[1]

CSAIL

Ngày kỷ niệm 40 năm thành lập dự án MAC, 1 tháng 7 năm 2003, LCS tái sáp nhập với phòng thí nghiệm AI để hình thành Phòng Thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo, hoặc CSAIL. Việc sáp nhập này tạo ra phòng thí nghiệm lớn nhất (hơn 600 nhân viên) trong khuôn viên trường MIT và được coi là một sự tái hợp các thành phần đa dạng trong dự án MAC.

Các hoạt động tiếp cận

Nhóm IMARA (từ tiếng Swahili có nghĩa là "quyền lực") tài trợ một loạt các chương trình, làm cầu nối cho Global Digital Divide. Mục đích của nó là để tìm và thực hiện các giải pháp lâu dài, bền vững mà sẽ làm tăng sự sẵn sàng của công nghệ và tài nguyên giáo dục cho cộng đồng trong nước và quốc tế. Các dự án này được điều hành dưới sự đảm bảo của CSAIL và nhân sự là các tình nguyện viên của MIT, những người này sẽ đào tạo, cài đặt và hiến tặng máy tính thiết lập tại Boston, Massachusetts, Kenya, Khu tự trị của người Da đỏ ở ở phía Tây Nam nước Mỹ cũng như quốc gia Navajo, Trung Đông và quần đảo Fiji. Dự án CommuniTech cố gắng để trao quyền cho các cộng đồng thiếu thốn thông qua giáo dục và công nghệ bền vững và thực hiện điều này thông qua các MIT Used Computer Factory (UCF), cung cấp máy tính tân trang lại cho các gia đình có hoàn cảnh khó khăn, và thông qua các lớp học Families Accessing Computer Technology (FACT), đào tạo những gia đình này để trở nên quen thuộc và thoải mái với công nghệ máy tính.[2][3][4]

Các nhà nghiên cứu nổi tiếng

(Bao gồm cả thành viên và cựu sinh viên của các phòng thí nghiệm tiền thân của CSAIL.)
  • MacArthur Fellows Sir Tim Berners-Lee, Erik Demaine, Dina Katabi, Daniela L. Rus, Peter Shor và Richard Stallman
  • Những người nhận giải thưởng Turing: Leonard M. Adleman, Fernando J. Corbato, Shafi Goldwasser, Butler W. Lampson, John McCarthy, Silvio Micali, Marvin Minsky, Ronald L. Rivest, Adi Shamir, và Barbara Liskov
  • Những người nhận giải thưởng Rolf Nevanlinna: Madhu Sudan, Peter Shor
  • Những người nhậngiải thưởng Gödel: Shafi Goldwasser (nhận 2 lần), Silvio Micali, Maurice Herlihy, Charles Rackoff, Johan Håstad, Peter Shor, và Madhu Sudan
  • Những người nhận giải thưởng Grace Murray Hopper: Robert Metcalfe, Shafi Goldwasser, Guy L. Steele, Richard Stallman, và W. Daniel Hillis
  • Tác giả sách giáo khoa Harold Abelson và Gerald Jay Sussman, Richard Stallman, Thomas H. Cormen, Charles E. Leiserson, Patrick Winston, Ronald L. Rivest, Barbara Liskov, John Guttag, Jerome H. Saltzer, Frans Kaashoek, và Clifford Stein
  • David D. Clark, cựu trưởng kiến trúc sư của giao thức Internet; đồng tác giả với Jerome H. Saltzer (cũng là một thành viên của CSAIL) và David P. Reed người ảnh hưởng lớn đến "Nguyên lý End-to-End  trong Thiết kế Hệ thống" 
  • Eric Grimson, chuyên gia về thị giác máy tính và các ứng dụng trong y học, được bổ nhiệm làm hiệu trưởng danh dự của MIT vào tháng 3 năm 2011
  • Bob Frankston, đồng phát triển của VisiCalc, bảng tính máy tính đầu tiên
  • Seymour Papert, người phát minh ra Ngôn ngữ lập trình Logo
  • Joseph Weizenbaum, tác giả của chương trình máy tính mô phỏng trị liệu ELIZA 
  • Constantinos Daskalakis, người nhận Giải thưởng luận án tiến sĩ ACM (2008) cho luận án "Swj phức tạp của Phương trình Nash"

Cựu sinh viên nổi tiếng

Nhiều cựu sinh viên của dự án MAC tiếp tục cách mạng hóa thêm ngành công nghiệp máy tính.

Giám đốc

Giám đốc của dự án MAC
  • Robert Fano, 1963–1968
  • J.C.R. Licklider, 1968–1971
  • Edward Fredkin, 1971–1974
  • Michael Dertouzos, 1974–1975
Giám đốc của phòng thí nghiệm AI
  • Marvin Minsky, 1970–1972
  • Patrick Winston, 1972–1997
  • Rodney Brooks, 1997–2003
Giám đốc của phòng thí nghiệm khoa học máy tính
  • Michael Dertouzos, 1975–2001
  • Victor Zue, 2001–2003
Giám đốc của CSAIL
  • Rodney Brooks, 2003–2007
  • Victor Zue, 2007–2011
  • Anant Agarwal, 2011–2012
  • Daniela L. Rus, 2012–

Xem thêm

Tài liệu tham khảo

  1. ^ Transcript of Richard Stallman's Speech, 28 Oct 2002, at the International Lisp Conference from gnu.org, retr 2012 sept
  2. ^ Outreach activities at CSAIL - CSAIL homepage, MIT.
  3. ^ IMARA Project at MIT
  4. ^ Fizz, Robyn; Mansur, Karla (ngày 4 tháng 6 năm 2008), “Helping MIT neighbors cross the 'digital divide' (PDF), MIT Tech Talk (Cambridge: MIT): 3

Đọc thêm

Liên kết ngoài

Triết học về trí tuệ nhân tạo theo Bách khoa toàn thư mở Wikipedia

Triết học về trí tuệ nhân tạo là một ngành triết học nghiên cứu bản chất của trí tuệ và trí tuệ nhân tạo nhằm trả lời những câu hỏi sau:
  • Máy tính có thể ứng xử thông minh hay không? Có thể giải quyết những vấn đề mà con người phải dùng suy nghĩ để giải quyết không?
  • Máy tính có thể có tâm trí, hiện tượng tâm lý và ý thức như con người không? Nó có thể cảm giác không?
  • Trí tuệ của con người và máy tính có giống nhau không? Phải chăng bộ não con người là một máy tính?
Ba câu hỏi trên phản ánh mối quan tâm của các nhà nghiên cứu trí tuệ nhân tạo, triết gia và các nhà nhận thức học. Câu trả lời cho những câu hỏi này phụ thuộc vào định nghĩa "trí tuệ" hay "ý thức" và cỗ máy chính xác đang được thảo luận.
Những mệnh đề quan trọng trong triết học về trí tuệ nhân tạo:
  • "Quy ước tao nhã" của Turing: Nếu một cỗ máy hành xử thông minh như một con người, nó thông minh như con người.
  • Đề xuất Dartmouth: "Mọi khía cạnh của việc học hay bất kỳ tính năng nào khác của trí tuệ đều có thể được mô tả chính xác tới mức máy tính có thể mô phỏng."
  • Lý thuyết về hệ thống ký hiệu hình thức của Newell và Simon: "Một hệ thống ký hiệu hình thức có các phương pháp cần và đủ của hành vi thông minh nói chung."
  • Lý thuyết trí tuệ nhân tạo mạnh của Searle: "Một máy tính lập trình phù hợp với các đầu ra và đầu vào đúng bằng cách nào đó sẽ có một ý thức tương tự ý thức của loài người"
  • Cơ chế Hobbes: "Lý trí đơn giản là tính toán."

Một cỗ máy có thể thể hiện như một "trí tuệ thông thường"?

Về lý thuyết hoàn toàn có thể tạo ra một cỗ máy có thể giải quyết tất cả các vấn đề của con người không? Đây là một câu hỏi được các nhà nghiên cứu trí tuệ nhân tạo quan tâm. Nó định nghĩa một phạm trù những gì các cỗ máy có thể làm trong tương lai và chỉ đường cho các nghiên cứu trí tuệ nhân tạo. Câu hỏi chú trọng vào các hành vi của máy và bỏ qua các vấn đề liên quan có thể sẽ làm các nhà tâm lý học, khoa học nhận thức hay triết học hứng thú; để trả lời câu hỏi, không quan trọng một cỗ máy có thực sự suy nghĩ (như một cá nhân) hay nó chỉ hành động như là có thể suy nghĩ.[1]
Luận điểm cơ bản của hầu hết các nhà nghiên cứu trí tuệ nhân tạo được tóm gọn trong một câu nói, lần đầu tiên xuất hiện là ở hội nghị Dartmouth năm 1956:
Arguments against the basic premise must show that building a working AI system is impossible, because there is some practical limit to the abilities of computers or that there is some special quality of the human mind that is necessary for thinking and yet cannot be duplicated by a machine (or by the methods of current AI research). Arguments in favor of the basic premise must show that such a system is possible.
The first step to answering the question is to clearly define "intelligence."

Tham khảo

  1. ^ See Russell & Norvig 2003, tr. 3, where they make the distinction between acting rationally and being rational, and define AI as the study of the former.
Bản mẫu:Triết học về khoa học Bản mẫu:Tâm lý học

Trí tuệ nhân tạo, deep learning, machine learning là gì, chúng hoạt động ra sao và có hạn chế nào?


3620160_cv
Trí tuệ nhân tạo ( artificial intelligence – AI) giờ xuất hiện ở khắp mọi nơi. Nó là thứ được sử dụng để trả lời email tự động trên Gmail, học cách lái xe cho chúng ta ngồi chơi, sắp xếp lại ảnh của những chuyến đi chơi thành từng album riêng biệt, thậm chí còn giúp quản lý ngôi nhà hay đi mua sắm nữa. Nhưng bạn có biết là trí tuệ nhân tạo không chỉ đơn giản là một thực thể mà nó còn được chia thành nhiều loại nhỏ hơn? Những hạn chế hiện tại của sản phẩm trí tuệ nhân tạo là gì? Và vì sao chúng ta không cần (hay chưa cần) phải lo lắng về việc trí tuệ nhân tạo bùng lên chiếm lấy thế giới?

Neural network, machine learning, deep learning là gì?

Đây là những cụm từ mà bạn rất thường hay thấy trong những thông tin liên quan đến trí tuệ nhân tạo. Về cơ bản, bạn có thể nghĩ về những thứ này như các lớp cấu thành trí tuệ nhân tạo.
Neural network, tạm gọi là mạng lưới thần kinh nhân tạo, sẽ nằm dưới cùng. Đây là hệ thống các máy tính và thiết bị hệ thống điện toán nói chung được kết nối theo một cách nào đó để mô phỏng lại một phần cách hoạt động của các nơ-ron thần kinh trong não người. Những chiếc máy tính trong neural network có thể nằm gần nhau trong cùng một phòng hay cách xa nhau cả nghìn cây số, mỗi một chiếc máy tính trong đó có thể được xem như một đơn vị thần kinh, gọi là node.
Cập nhật: Neural network không nhất thiết phải dựa trên phần cứng, nó vẫn có thể là phần mềm và các giải thuật.
Khái niệm về neural network đã có từ những năm 1950 với sự ra đời của ngành nghiên cứu về trí tuệ nhân tạo. Người ta nói rằng khi nằm riêng biệt, những node máy tính này chỉ chạy những gì được lập trình sẵn và chỉ có thể trả lời những câu hỏi đơn giản, hay nói cách là nó “không thông minh”. Cũng giống như trong cơ thể người, một nơ-ron không chưa làm nên chuyện, nhưng khi kết nối chúng thành một mạng lưới dày đặt thì mọi chuyện sẽ khác đi rất nhiều. Khi các hệ thống máy tính được nối lại với nhau, chúng có thể giải quyết những vấn đề khó khăn hơn. Và quan trọng nhất, khi áp dụng đúng thuật toán, người ta có thể “dạy học” cho máy tính.
Lớp kế tiếp là machine learning. Từ này mình không biết nên dịch sang tiếng Việt như thế nào cho chính xác nên tạm thời cứ để nguyên tiếng Anh. Đây là một chương trình chạy trên neural network, nó sẽ làm nhiệm vụ huấn luyện máy tính để “học hỏi” một vấn đề gì đó, ví dụ như học hỏi từ hàng nhìn mẫu chữ viết tay của người dùng để đoán xem đó là kí tự gì, hoặc học từ hàng nghìn bức ảnh chụp bãi biển để tìm ra điểm chung và sau đó nhìn phát là biết ngay tấm này chụp biển chứ không phải chụp núi.
Deep learning nằm ở trên cùng, cũng không biết dịch ra tiếng Việt như thế nào. Đây là một nhánh đặc biệt của ngành khoa học machine learning. Deep learning trở nên phổ biến trong thập kỉ gần đây nhờ vào sự gia tăng nhanh chóng của lượng dữ liệu số mà loài người tạo ra, ngoài còn nhờ sức mạnh xử lý của máy tính gia tăng trong khi giá thành giảm xuống. Sẽ nói kĩ hơn về deep learning ở bên dưới.

Trí tuệ nhân tạo hoạt động ra sao?

Giả sử như bạn muốn một cái máy tính biết cách băng qua đường. Theo cách truyền thống, chúng ta sẽ lập trình cho nó cách nhìn trái, nhìn phải, cách đợi xe chạy qua hết, cách đi đúng vạch băng đường theo luật và nhiều thứ khác, sau đó để cho máy tự đi.
Còn với kĩ thuật trí tuệ nhân tạo, mà cụ thể là một chương trình machine learning, bạn sẽ cho máy tính xem 10.000 đoạn video về cách băng đường an toàn. Kế tiếp bạn lại cho nó xem thêm 10.000 đoạn video nữa nhưng lần này chiếu cảnh người ta bị xe tông khi băng đường ẩu. Lúc này bạn mới thả cho nó tự băng đường.
google_self_driving_car.0.
Phần khó nhất đó là bạn phải làm sao cho máy tính hiểu và tiếp thu được thông tin từ các video này, cũng giống như phần khó nhất khi đi dạy học là phải làm cho học sinh hiểu được bạn nói gì và ghi nhớ điều đó. Trong nhiều thập kỉ qua, người ta đã thủ nhiều phương pháp khác nhau để dạy cho máy tính học. Một trong những cách đã được xài đó là “reinforcement learning”, tức là bạn sẽ “thưởng” cho máy tính khi nó làm đúng thứ bạn muốn rồi từ từ tối ưu để đạt kết quả tốt nhất. Người ta vẫn thường hay huấn luyện thú vật theo cách này. Một cách khác nữa là “chọn lọc tự nhiên”, tức là nhiều cách giải quyết cùng một vấn đề sẽ được áp dụng cho chạy song song, cái này giải được nhanh và chính xác nhất sẽ thắng những cái còn lại.
Còn trong thời đại ngày nay, người ta xài một phương pháp gọi là deep learning. Deep learning sử dụng nhiều lớp trong một neural network để phân tích dữ liệu theo nhiều khía cạnh khác nhau. Ví dụ, nếu bạn đưa cho máy tính học một tấm ảnh theo kĩ thuật deep learning, mỗi lớp trong mạng lưới thần kinh nhân tạo này sẽ nhìn nhận vấn đề theo một cách riêng. Lớp dưới cùng sẽ chỉ đơn giản là vẽ ra một cái lưới 5×5 lên tám ảnh và đánh dấu “có” hoặc “không” khi có một đối tượng xuất hiện trong ô. Nếu “có”, lớp bên trên sẽ bắt đầu nhìn vào từng ô này một cách kĩ càng hơn, nó phân tích xem đây có phải là điểm đầu của một đường thẳng không, hay đây là một cái góc nghiêng? Thật nhiều lớp như thế sẽ giúp phần mềm hiểu được những vấn đề phức tạp, tất cả đều dựa trên các bẻ nhỏ nó ra rồi “điều tra” từ từ. Cũng chính vì lý do này mà người ta gọi đây là “deep”, tức là sâu và có nhiều lớp.
DeepFace.
Kĩ thuật được Facebook áp dụng để nhận diện gương mặt, trong đó chia bức ảnh thành lớp khác nhau để học hỏi​
Yann LeCun, trưởng bộ phận trí tuệ nhân tạo của Facebook, cho biết: “Khi bạn đi lên các lớp cao hơn thì những thứ được phát hiện sẽ càng lúc càng rộng hơn. Càng lúc càng có nhiều khía cạnh hơn được phân tích. Và khi bạn leo lên đến lớp cao nhất, bạn sẽ có những công cụ để cho bạn biết bức hình đó đang chụp người hay một chút chó hay một chiếc máy bay”.
Nãy giờ chúng ta chỉ mới nói đến chuyện nhận biết, giờ thì đến lúc dạy cho máy tính biết thứ mà nó vừa nhận ra là gì. Một hệ thống neural network lại được sử dụng, nhưng lần này nó sẽ xem xét nhiều đặc điểm của một con mèo. Rất nhiều bức hình chụp mèo cũng sẽ được đưa cho hệ thống xem kèm theo lời dặn: đây là ảnh con mèo đó nha. Rồi người ta lại cho máy xem thêm một loạt ảnh khác nữa chụp chó, heo, gấu, vịt và dặn: đây không phải là con mèo. Thông qua hàng loạt dữ liệu như vậy, phần mềm sẽ biết được những con mèo thường có điểm chung gì, móng, lông, tay chân, đầu, đuôi của chúng ra sao thì mới được gọi là mèo…
Theo thời gian, máy sẽ ghi nhớ những dữ liệu này và sắp xếp theo thứ tự quan trọng. Ví dụ, móng vuốt không chỉ mèo mới có, nhưng nếu móng đi chung với bàn chân to và ria mép thì đây đích thị là con mèo. Các mối liên hệ như thế này cũng sẽ được cung cấp theo thời gian trong quá trình phần mềm machine learning học hỏi các ảnh. Quy trình này diễn ra trong thời gian dài và lặp đi lặp lại nhiều lần. Cứ lần sau nó sẽ tốt hơn lần trước vì được góp ý từ con người hoặc thậm chí là từ những hệ thống trí tuệ nhân tạo khác.
Bạn có thể thấy rằng chỉ để nhận biết được một con mèo thôi đã phức tạp quá chừng, trong khi các hệ thống machine learning của Facebook, Google hay Microsoft phải nhận biết nhiều thứ khác nữa trong đời sống. Thế nên, việc Microsoft tự hào khi phát hành một ứng dụng có khả năng nhận biết các giống chó khó nhanh nghe có vẻ đơn giản nhưng phía sau nó là cả một mạng lưới thần kinh nhân tạo phức tạp và đã bắt đầu chạy học hỏi trong thời gian rất dài rồi
dogknight_3346130k.0.
Hình ảnh được tạo ra từ dự án trí tuệ nhân tạo Google Drea​

Đây có phải là thứ mà Google, Facebook và nhiều công ty khác đang sử dụng?

Câu trả lời chung sẽ là “Đúng rồi”.
Deep learning hiện tại đang được xài cho nhiều tác vụ khác nhau. Các công ty công nghệ lớn thường lập riêng một bộ phận trí tuệ nhân tạo. Google, Facebook còn mở những hệ thống phần mềm machine learning của mình ra cho mọi người sử dụng. Google hồi tháng trước cũng mới mở một khóa học kéo dài 3 tháng vè machine learning và deep learning.
Một vài ví dụ về machine learning đó là công cụ Google Photos. Nó có khả năng nhận biết và phân loại hình ảnh mà bạn chụp theo từng chủ đề khác nhau, thậm chí là theo từng khuôn mặt khác nhau một cách tự động. Hay Facebook M, một trợ lý ảo cá nhân nửa người nửa máy có thể giúp bạn đặt một số món hàng mà bạn muốn. Microsoft với Cortana, Google với Google Now và Apple với Siri đều là những ví dụ rất thực của trí tuệ nhân tạo.
Đây cũng là lý do vì sao mà trong thời gian gần đây chúng ta bắt đầu nghe nói nhiều về machine learning, deep learning và trí tuệ nhân tạo. Đó là vì các hãng tiêu dùng lớn đã bắt đầu nhảy vào cuộc chơi và đưa ra những sản phẩm thực tế mà người ta có thể cầm nắm và trải nghiệm. Trước đó, deep learning và machine learning chỉ nằm trong các phòng thí nghiệm ở những viện nghiên cứu và trường đại học mà thôi.

Hạn chế của trí tuệ nhân tạo hiện nay

Deep learning đang được sử dụng cho những thứ như nhận dạng giọng nói và nhận dạng hình ảnh, những thứ có nhiều tiềm năng thương mại hóa. Nhưng song song đó, nó cũng còn nhiều hạn chế.
Đầu tiên, deep learning cần một lượng dữ liệu đầu vào khổng lồ để máy tính có thể học hỏi. Quy trình này mất nhiều thời gian, nhiều sức mạnh xử lý mà chỉ có các server cỡ lớn mới làm được. Nếu không có đủ dữ liệu đầu vào, hay có đủ dữ liệu nhưng không đủ sức mạnh để xử lý, thì mọi thứ không thể diễn ra đúng như ý định, kết quả do máy học sẽ không chính xác.
Thứ hai, deep learning vẫn chưa thể nhận biết được những thứ phức tạp, ví dụ như các mối liên hệ thông thường. Chúng cũng sẽ gặp khó khăn khi cần nhận biết những thứ tương tự nhau. Lý do là vì hiện chưa có kĩ thuật nào đủ tốt để trí tuệ nhân tạo có thể rút ra những kết luận đó một cách logic. Bên cạnh đó, vẫn còn nhiều thách thức trong việc tích hợp kiến thức trừu tượng vào các hệ thống machine learning, ví dụ như thông tin về vật đó là gì, nó dùng để làm gì, người ta hay xài nó làm sao… Nói cách khác, machine learning chưa có được những kiến thức thông thường như con người.
Một ví dụ rất cụ thể cho các bạn dễ hiểu: trong một dự án của Google, một mạng lưới thần kinh được sử dụng để tạo ra bức ảnh của một quả tạ mà người ta hay cầm tập trong phòng gym. Kết quả đưa ra khá ấn tượng: hai vòng tròn màu xám được kết nối bằng một cái ống ngang. Nhưng ở giữa cái ống này còn có cánh tay của con người, và đây không phải là thứ nằm trong “đề bài”. Lý do thì khá là dễ đoán: hệ thống được dạy về quả tạ bằng những tấm hình chụp người ta đang cử tạ, vậy nên dính tay người vào là chuyện hiển nhiên. Hệ thống có thể biết được quả tạ ra sao, nhưng nó không biết là quả tạo sẽ không bao giờ có cánh tay cả.
dumbbells.0.
Với một số bức hình đơn giản hơn nhưng mahcine vẫn nhầm lẫn. Thử nghiệm của một nhóm nhà nghiên cứu cho thấy rằng khi họ đưa máy tính xem một loạt ảnh chỉ có các pixel ngẫu nhiên nhưng máy lại chắc chắn đây 95% là một cái… xe tải, hay là một con sao biển…
Đó chưa phải là tất cả. Theo lời của nhà khoa học máy tính Hector Levesque, những công cụ trí tuệ nhân tạo hiện nay sử dụng nhiều “mánh” để xóa đi những lỗ hổng thật sự trong kiến thức của chúng. Các trợ lý ảo như Siri hay Cortana thường làm cho bạn có cảm giác bạn đang nói chuyện với người thật vì chúng sử dụng các câu nói đùa, câu trích dẫn, các biểu hiện cảm xúc và nhiều thứ khác, cốt chỉ để bạn phân tâm.
Bạn hãy thử hỏi những thứ cần đến suy nghĩ thông thường, ví dụ như “con cá xấu có lái xe được không” hay “một cầu thủ đá banh có được phép gắn cánh để bay hay không”. Các câu hỏi dạng này quá phức tạp với những hệ thống trí tuệ nhân tạo hiện nay nên thường sẽ không có kết quả nào được trả về cho bạn, nếu có cũng là những thứ không liên quan hay chỉ đơn giản là search câu nói của bạn trên Internet.

Mùa đông AI

Ngành khoa học trí tuệ nhân tạo là một ngành dễ lên nhưng cũng dễ xuống. Năm 1958, tờ New York Times từng nói về một chiếc máy có khả năng phân biệt bên trái và bên phải như là một dạng mầm sống của robot thông minh. Nhưng đến nay, chúng ta vẫn chưa thể tạo ra được một con robot nào có trí thông minh đến vậy. Và khi những lời hứa hẹn đó không được thực hiện, người ta dùng từ “mùa đông AI”. Đó là giai đoạn mà lượng tiền đầu tư cho AI giảm mạnh, ít còn ai nhắc về nó, và người ta cũng tỏ ra hoài nghi về những kết quả có thể đạt được. Tính đến nay đã có khoảng 6 “mùa đông AI” nhỏ và 2 mùa lớn từng xuất hiện, vào cuối những năm 70 và đầu các năm 90.

Trí tuệ nhân tạo có tri giác?

Nhiều người đang làm việc trong ngành trí tuệ nhân tạo cho rằng chúng ta sẽ rất khó để tạo ra một trí tuệ nhân tạo có tri giác. “Có rất ít bằng chứng ở thời điểm hiện tại cho thấy hi vọng về việc tạo ra một trí tuệ nhân tạo có tính linh hoạt cao và làm được những thứ mà chúng không được tạo ra để thực hiện”, theo lời giáo sư Andrei Barbu từ đại học MIT. Ông nhấn mạnh việc nghiên cứu trí tuệ nhân tạo hiện nay chỉ tạo ra được những hệ thống được tối ưu để giải quyết một vấn đề cụ thể mà thôi.
Cũng đã có một số công trình nghiên cứu về việc cho máy tính học nhưng không cần sự giám sát, tức là cứ đưa dữ liệu cho máy học mà không dán nhãn đúng sai hay giải thích gì cả. Tuy nhiên, Andrei Barbu nhận xét những dự án như thế này vẫn chưa có tiến triển nào và vẫn còn rất xa xời để đến được ngày có kết quả. Một ví dụ đã từng xuất hiện đó là một hệ thống neural network của Google đã từng lấy ngẫu nhiên ảnh thumbnail của 10 triệu video trên YouTube để tự dạy mình con mèo trông giống như thế nào. Thế nhưng, Google nói đây chỉ là một thử nghiệm và không nói gì về độ chính xác của nó cả.
Nói cách khác, chúng ta vẫn chưa biết cách làm cho máy tính tự học mà không cần giám sát. Đó là rào cản lớn nhất. Tức là vẫn còn rất xa mới tới cái ngày mà robot có tri giác và đánh trả lại con người :D
Như Elon Musk đã nói, công ty ông có tạo ra một trí tuệ nhân tạo cho tính năng tự lái xe trên những chiếc Tesla. Nhưng ông chưa bao giờ nói rằng nó sẽ biết hết mọi thứ. Đây chỉ đơn giản là một mạng lưới giúp các xe học hỏi lẫn nhau. Khi một chiếc này học được điều gì thì những chiếc khác cũng biết điều tương tự. Kết quả cuối cùng không phải là những chiếc xe có thể làm mọi thứ trên đời, nó chỉ để giải quyết một vấn đề rất cụ thể mà thôi.

Monday, March 7, 2016

Rankbrain và thuật toán trí tuệ nhân tạo của Google


Thời gian vừa qua, Google đã đưa vào sử dụng hệ thống trí thông minh nhân tạo mang tên RankBrain vào cỗ máy tìm kiếm của mình. Với hệ thống này nó  sẽ giúp phân loại kết quả tìm kiếm của mình. Chúng ta đang tự hỏi liệu công trình này có phù hợp với hệ thống xếp hạng tổng thể của Google? Dưới đây là những gì chúng tôi biết về RankBrain.
slide
RankBrain sử dụng hệ thống ngôn ngữ viết để phiên dịch những thông tin mà người dùng tìm kiếm. Đôi khi, những cụm từ tìm kiếm quá mơ hồ hoặc người dùng sử dụng những tiếng lóng thành ngữ khiến thuật toán tìm kiếm không thể hiểu được. Đấy là lúc RankBrain phát huy khả năng học hỏi người dùng độc đáo của mình. Mặc dù chưa từng nghe hoặc tương tác với những dữ liệu tìm kiếm trước đây, RankBrain có thể trở thành một “sinh viên dự thính” để học hỏi về các thông trong quá khứ được ghi nhận bởi Google. Chính vì thế, hệ thống sẽ ngày càng trở nên hoàn thiện với việc tiếp cận người dùng trong tương lai.
Ờ thời điểm hiện tại, RankBrain đã cho ra những kết quả khả quan sau hơn một năm được nghiên cứu, lập trình bởi đội ngũ kỹ sư Google. Hệ thống này đã được đưa vào bộ công cụ tìm kiếm vào đầu năm 2015 và hiện đang xếp thứ 3 trong số những tín hiệu được sử dụng trong những tìm kiếm trên Google.

RankBrain là gì?
RankBrain là tên của một hệ thống trí thông minh nhân tạo tự học mới giúp đưa ra kết quả tìm kiếm, theo báo của Bloomberg và được xác nhận bởi Google. RankBrain đã không chiếm đoạt ngai vàng của PageRank. Đúng hơn nó là một phần của thuật toán lớn hơn trong việc lấy các truy vấn tìm kiếm, giải thích những gì người dùng đang tìm kiếm và nghĩ ra cách làm thế nào để gửi yêu cầu đó theo những cách mới. RankBrain là tên mà Google đặt cho một hệ thống trí tuệ nhân tạo Machine-learning được sử dụng để giúp Google xử lý kết quả tìm kiếm.
Machine-learning – Học máy: Một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kỹ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể “học” cách phân loại thư điện thử xem có phải thư rác (spam) hay không và tự động xếp thư vào mục tương ứng – Wikipedia.
Vậy AI khác Mechine-learning như thế nào? Trong trường hợp này, có vẻ như Google đang sử dụng chúng như những từ đồng nghĩa và được họ sử dụng thay thế cho nhau, hoặc bạn có thể thấy Machine-learning được dùng để mô tả các dạng trí tuệ nhân tạo được sử dụng.
Thế nào là hệ thống máy móc tự học?
Hệ thống máy tự học là khi mà máy tính tự dạy nó cách xử lý vấn đề gì đó chứ không cần phải được con người chỉ dạy chi tiết bằng thuật toán.
Trí thông minh nhân tạo là gì?
Trí thông minh nhân tạo đúng nghĩa, còn gọi là AI, là một máy tính có thể thông minh như con người, ít nhất là trong vấn đề học hỏi kiến thức từ việc được dạy hoặc tự xây dựng kiến thức và liên kết chúng lại.
Tất nhiên, AI thật sự chỉ tồn tại trong các tác phẩm khoa học viễn tương. Trong thực tế, AI được dùng để chỉ hệ thống máy tính thiết kế để tự học và liên kết thông tin.
Vậy RankBrain là cách sắp xếp kết quả tìm kiếm mới?
Không phải. RankBrain chỉ là một phần của tổng hợp nhiều thuật toán, một phần mềm máy tính có thể sắp xếp hàng tỉ trang mà nó biết và tìm những trang có kết quả phù hợp nhất với từ khóa người dùng tìm.
Tên của thuật toán tìm kiếm của Google là gì?
Nó là Hummingbird (chim nhại). Trong nhiều năm, các thuật toán không có tên gọi theo kiểu đàng hoàng. Nhưng vào giữa 2013, Google đã bắt đầu đặt tên cho thuật toán này là Hummingbird.
Vậy RankBrain là một phần của Hummingbird?
Đó là những gì chúng tôi hiểu. Hummingbird là thuật toán tổng của toàn bộ search, cũng giống như chiếc xe với một động cơ tổng thể. Động cơ đó có thể được kết hợp bởi nhiều thành phần, như lọc dầu, nhiên liệu và những thứ khác. Cũng giống vậy, Hummingbird kết hợp nhiều thành phần, RankBrain là một thành phần mới nhất. Cụ thể, chúng tôi biết RankBrain là thành phần của Hummingbird bởi vì trong báo cáo của Bloomberg đã nói rõ RankBrain không kiểm soát toàn bộ search.
Hummingbird cũng chứa những phần khác với các cái tên quen thuộc như Panda, Penguin, Payday để chống lại spam, Pigeon để tăng hiệu quả của local search, Top Heavy chống lại các trang có ad quá nặng, Mobile Friendly để tăng cơ hội xếp hạng cao cho các trang tương thích di động và Pirate để chống lại vấn đề vi phạm bản quyền.
Và nói một cách dễ hiểu, Hummingbird là thuật toán tìm kiếm tổng thể, giống như một chiếc xe có động cơ. Và các bộ phận chính được tạo ra từ nhiều bộ phận khác nhau, chẳng hạn như một bộ lọc dầu, bơm nhiên liệu hay bộ tản nhiệt. Cũng như vậy, Hummingbird gồm các bộ phận khác nhau, và RankBrain là một trong những phần mới nhất của thuật toán này.
Tôi nghĩ thuật toán này mang tên PageRank?
PageRank chỉ là một phần của thuật toán Hummingbird, nó là cách thức chấm điểm các trang dựa vào những đường link trỏ về từ các trang khác. PageRank đặc biệt bỏi nó là thành phần đầu tiên được Google đặt tên, từ năm 1998.
RankBrain? Đó có phải là SkyNet? Hoặc Agent Smith?
Không. RankBrain có nhận thức. Nói RankBrain “học” không có nghĩa là bạn có thể ngồi lại với nó, đưa cho nó những nguyên tắc cơ bản về đại số và đặt nó vào để giải quyết phương trình X.
Thay vào đó, nó được cho ăn bởi số lượng lịch sử tìm kiếm và kết quả của họ và suy ra thông tin này để tiên đoán về tương lai tìm kiếm.
Và RankBrain đã chứng minh rằng nó có thể ghi điểm thật sự xuất sắc.
Kỹ sư tìm kiếm của Google, người đã xây dựng được những thuật toán làm cơ sở cho các phần mềm tìm kiếm và dự đoán những gì chúng sẽ được xếp hạng top đầu, chúng đã làm khá tốt.
Trong thực tế, Google phát hiện ra rằng việc tắt RankBrain “sẽ làm tổn hại cho người dùng” – theo Greg Corrado, nhà nghiên cứu khoa học tại Google cho biết.
Vậy RankBrain sẽ làm gì cho SEO?
Corrado nói rằng RankBrain là “tín hiệu quan trọng thứ 3 góp phần tạo nên kết quả của một truy vấn tìm kiếm”, điều đó là hợp lý để nói rằng nó có thể và có ảnh hưởng đến SEO.
Mặc dù Google đã bắt đầu tung ra RankBrain một vài tháng trước đây, nó đã không có tác dụng tương tự giống như Penguin hay Panda đã làm được.
Còn bây giờ, RankBrain nhỏ như HAL 9000 hoặc Terminator T-800 và lớn hơn Johnny 5 hoặc Wall-E: một người bạn chứ không phải là kẻ thù.
Theo dự đoán của tôi là các tổ chức SEO thông minh sẽ bắt đầu thử nghiệm, đặc biệt là khi nói đến các doanh nghiệp nhỏ và tìm kiếm địa phương để tìm hiểu xem liệu họ có thể kéo lên bức màn về RankBrain và tìm hiểu xem điều gì khiến nó hoạt động – do đó họ sẽ có cơ hội được xếp hạng trong SERPs.
Chính xác thì RankBrain làm gì?
Từ những email với Google, RankBrain được sử dụng chủ yếu để hiểu những gì mà người dùng gõ vào ô tìm kiếm để bắt đầu tìm kiếm trang mà có thể không có chính xác từ khóa họ tìm.
Vậy Google đã từng có thuật toán để đưa ra các trang không có chính xác từ khóa chưa?
Rồi. Google đã tìm kiếm các trang không có chính xác từ khóa trong thời gian dài. Ví dụ, rất nhiều năm trước, nếu bạn gõ vào các từ như “shoe” Google sẽ không tìm thấy trang có từ “shoes”, bởi nó là 2 từ khác nhau. Với sự phát triển của mình, Google đã có sự thông minh với từ đồng nghĩa. Nếu bạn gõ vào “sneakers” thì nó có thể hiểu đó là “running shoes”. Nó còn có thể hiểu được cả ngữ cảnh để phân biệt được trang của Apple về công nghệ và “apple” nói về trái táo.
Vậy còn Knowledge Graph?
Knowledge graph ra mắt năm 2012, nó là các kết nối các từ ngữ thông minh hơn của Google. Quan trọng hơn, nó biết các làm sao để tìm kiếm các dữ liệu cho chuỗi từ khóa, như Google đã nói.
Chuỗi nghĩa chuỗi các chữ cái. Còn dữ liệu là khi người dùng tìm “Obama”, Google sẽ hiểu là “US President Barank Obama”, một người có kết nối với những người khác, địa điểm và sự kiện khác.
Knowledge Graph là một kho dữ liệu về vấn đề trên thế giới và sự liên kết giữa chúng. Đó là lý do tại sao bạn có thể tìm kiếm “vợ obama ra đời khi nào?” và có được kết quả của Michele Obama, mà không tìm kiếm tên của bà ấy
when_was_the_wife_of_obama_born_-_Google_Search-800x573
Khi nào RankBrain bắt đầu?
Google nói rằng nó đã được triển khai từ từ đầu năm 2015 và đã cập nhật hoàn toàn vài tháng trở lại đây
Những từ khóa nào bị ảnh hưởng?
Google nói với Bloomberg rằng có rất nhiều từ khóa bị ảnh hưởng bởi RankBrain. Chúng tôi hỏi thêm thông tin cụ thể nhưng họ không nói rõ ràng.
Có phải RankBrain lúc nào cũng học hỏi?
Việc học của RankBrain luôn tiến hành offline, Google đã nói vậy. Nó đưa ra danh sách các tìm kiếm và học hỏi để đưa ra dự đoán từ chúng. Những dự đoán này được kiểm tra và chứng minh rằng nó tốt, bởi vậy RankBrain đã được cập nhật hoàn toàn. Sau đó quy trình học hỏi offline và kiểm tra được lặp đi lặp lại.

7 xu hướng thiết kế web năm 2016

Dưới đây là các xu hướng về thiết kế web kỹ thuật số sẽ định hình trong năm tới. Từ năm 2016 trở đi, công nghệ thiết kế web có sự thay đổi đáng kể.
web0'

1. Trí tuệ nhân tạo

Trí thông minh nhân tạo sẽ tác động đáng kể lên tư duy thiết kế kỹ thuật số của các nhà thiết kế. Theo nhận thức ban đầu, thiết kế là công việc phía sau, có nhiệm vụ biến mọi thứ trở nên rõ ràng hơn. Khi ngày càng nhiều ứng dụng có xu hướng hiện diện bằng thông tin ngữ cảnh, thì trí tuệ nhân tạo sẽ phát huy tác dụng hỗ trợ cho chúng ta đưa ra các thao tác phù hợp dựa trên thông tin đó.

Điều này thể hiện rất rõ trên các ứng dụng di động và đang dần chuyển sang web. Ví dụ điển hình nhất là M của Facebook. Mặc dù tương tự với Siri, nhưng M có thể thực thi các nhiệm vụ rõ ràng hơn so với đối thủ của nó.

"M là trợ lý kỹ thuật số cá nhân bên trong Messenger nhằm hoàn tất các nhiệm vụ và tìm thông tin thay cho bạn. Nó được hỗ trợ bởi trí tuệ nhân tạo đã được huấn luyện và giám sát", David Marcus Messenger @ Facebook cho biết.

 
web1

Một ví dụ khác là Trả lời Thông minh (Smart Reply) cho Gmail của Google. Smart Reply làm cho cuộc sống của người dùng Gmail trở nên dễ dàng hơn bằng cách gợi ý 3 câu trả lời dựa trên các email đã được gửi đi.

2. Tập trung vào sự tương tác thay vì bố trí (layout)

Theo truyền thống, thiết kế kỹ thuật số sẽ bắt đầu quy trình thiết kế bằng các phần mềm thiết kế như Photoshop. Cái nhìn trực quan và layout sẽ quyết định ở giai đoạn đầu của việc thiết kế. Điều này thuận lợi cho việc đưa ra ý tưởng để nhìn và cảm nhận về một thiết kế nhưng nó lại khá hạn chế khi các thiết kế được đem ra xem xét trông như thế nào và hoạt động ra làm sao với nội dung động, cũng như cảm nhận tương tác thực sự.

Để đáp ứng điều này, các công ty phần mềm đã bắt đầu tạo ra các công cụ thiết kế tương thích như Adobe Comet và Sparkbox. Các công cụ mới này cho phép các nhà thiết kế tập trung vào sự tương tác thay vì chỉ tập trung vào layout. Cách thức mới tạo ra các tài liệu thiết kế động còn cho phép các nhà thiết kế có nhiều thời gian hơn để suy nghĩ về việc làm thế nào tạo ra nhiều tương tác hơn thay vì chỉ suy nghĩ về layout khi thiết kế đã được mã hóa.

 
web2

3. Thiết kế theo định hướng dữ liệu 

Đến năm 2016, chúng ta sẽ tiếp tục chứng kiến sự chuyển đổi gu thẩm mỹ của các thiết kế. Thiết kế là kết quả của các ý kiến chủ quan. Các tổ chức lớn có quyền truy cập vào công cụ kinh doanh thông minh và có khả năng đo lường cũng như thiết kế lặp lại bằng các số liệu như tỷ lệ nhấp chuột, chuyển đổi, AB và đa biến thử nghiệm, v.v… tuy nhiên nhiều tổ chức nhỏ hơn thì lại không. Sự nổi lên của các công cụ mới như Apropose sẽ làm cho thiết kế theo chiều hướng dữ liệu ngày càng thông dụng hơn.

4. Đồ họa

Khi ngày càng nhiều thiết bị retina (võng mạc) xuất hiện trên thị trường, thì hình ảnh trên các trang web cũ sẽ dễ bị bóp méo trên các thiết bị này. Cách thức giải quyết vấn đề trên là sử dụng các hình ảnh đồ họa vector trong các định dạng hình ảnh. Ưu điểm của đồ họa vector là có thể thu nhỏ kích thước bất kỳ mà không mất đi chi tiết.

Một vài năm trước, định dạng hình ảnh mới được giới thiệu có tên SVG cũng được xem như một định dạng đồ họa vector. Điều tuyệt vời về các tập tin này là các nhà đồ họa sử dụng phần mềm như Adobe Illustrator có thể xuất các đồ họa vector của họ một cách trực tiếp ra file svg để hiển thị trên web. Hiện tại, SVG hỗ trợ cho tất cả các trình duyệt lớn đời mới.

 
web4

5. Kể chuyện

Kể chuyện là một phần của bản chất con người. Chúng ta đọc tiểu thuyết, xem phim và kịch. Vì vậy, các trang web kể chuyện thường thu hút và khơi gợi cảm xúc người dùng hơn.

Kể chuyện đòi hỏi phải tạo ra được yếu tố trực quan và giao diện mà người dùng muốn tương tác. Đặt trọng tâm vào sự chuyển đổi, các nhà thiết kế được khuyến khích sử dụng kỹ thuật này nhiều hơn và chúng ta sẽ nhìn thấy kể chuyện xuất hiện nhiều hơn trong các thiết kế kỹ thuật số.

 
web5

6. Cuộn dài

Với xu hướng kể chuyện trên các trang web ngày càng thu hút người dùng, cấu trúc cuộn dài sẽ liên kết các nội dung trên web với nhau được tốt nhất. Các trang web cuộn dài cho phép người dùng trải nghiệm liên tục các nội dung mà không bị ngắt quảng.

7. Sự tối giản sẽ tiếp tục phát triển mạnh

Sự tối giản sẽ trở nên phổ biến trong thời gian tới, do sự thông dụng của các "thiết kế phẳng" và các khuôn khổ như thiết kế của Google. Một số người đã chỉ trích các website có thiết kế tối giản vì nhiều trang web đang bắt đầu có xu hướng trông khá giống nhau.

Lý do xảy ra điều này do sự phổ biến của các mẫu thiết kế kỹ thuật số. Công nghệ thiết kế mẫu ngày nay đã trưởng thành và kết quả của điều này làm cho sự sáng tạo ra các mô hình mới không còn chỗ đứng.