Neural Network Part 1
Perceptrons
A perceptron takes several binary inputs, and produces a single binary output:
Weights, real numbers expressing the importance of the respective inputs to the output. The neuron’s output, or , is determined by whether the weighted sum is less than or greater than some threshold value.
Just like the weights, the threshold is a real number which is a parameter of the neuron.
Using the bias instead of the threshold, the perceptron rule can be rewritten:
Briefly
- Perceptron is that it’s a device that makes decisions by weighing up evidence. That’s the basic mathematical model
- By varying the weights and the threshold, we can get different models of decision-making.
- Complex network of perceptrons could make quite subtle decisions.
- We can think of the bias as a measure of how easy it is to get the perceptron to output a 1.
- Another way perceptrons can be used is to compute the elementary logical functions we usually think of as underlying computation, functions such as AND, OR, and NAND.
- We can use networks of perceptrons to compute any logical function at all.
“We can devise learning algorithms which can automatically tune the weights and biases of a network of artificial neurons. This tuning happens in response to external stimuli, without direct intervention by a programmer.”
Sigmoid Neurons
A small change in the weights or bias of any single perceptron in the network can sometimes cause the output of that perceptron to completely flip, say from 0 to 1.
Sigmoid neurons are similar to perceptrons, but modified so that small changes in their weights and bias cause only a small change in their output.
The architecture of neural networks
Neural network нь дараах ерөнхийдөө дараах 3 давхаргаас бүрддэг.
- Input Layer буюу оролтын давхарга
- Хамгийн зүүн захын давхаргыг хэлэх ба input neurons -уудыг агуулж байдаг
- Output Layer буюу гаралтын давхарга
- Хамгийн баруун захын давхаргыг хэлэх ба output neurons -уудыг агуулж байдаг
- Hidden Layer буюу нуугдал давхарга
- input layer болон output layer -ээс бусад давхаргыг хэлнэ.
Жишээ нь доорх neural network нь 4-н давхаргаас бүтсэн бөгөөд, 2 hidder layer агуулсан байна.
Input layer болон output layer -ийн хэлбэрийг дүрслэх нь хялбархан байх ба эсрэгээрээ hidden layer-ийн хэлбэрийг дүрслэх нь нарийн тооцоолол шаардана.
Жишээ нь гараар бичсэн 0-9
хүртэл бичсэн цифрүүдийг таниулах зориулалттай neural network зохиох үед,
хэрэв оролтын зураг нь 64x64
гэсэн хэмжээтэй бол input layer нь 4096 neuron-аас бүрдэх ба,
output layer нь 0-9
хүртэлх буюу 10 neurons -аас бүрдэх байдлаар хялбархан зохиож болно.
Тэгвэл hidden layer -ийг ямар хэлбэртэй байхыг тооцоолох боломжгүй боловч судлаачид өөрсдийн гэсэн heuristics хэлбэрийг гаргасан байдаг.
Нэг давхаргын гаралт нь дараагийн давхаргын оролт болсон neural network-ийг feadforward neural network гэж нэрлэнэ. Өөрөөр хэлбэл feedforward neural network-т loop буюу тойрог байх боломжгүй юм.
Гэсэн хэдий ч feedback төрлийн, өөрөөсөө өмнөх давхаргатаа нөлөөлдөг neural network байдаг ба түүнийг Recurrent Neural Network (RNN) гэж нэрлэдэг.